Imaginez pouvoir converser avec une IA aussi naturellement qu’avec un être humain. C’est ce que promet ElevenLabs, une startup innovante dans le domaine de la synthèse vocale, qui vient de lancer une plateforme révolutionnaire permettant de créer des agents conversationnels d’IA sur mesure.
Une avancée majeure dans l’IA conversationnelle
Jusqu’à présent, ElevenLabs était surtout connue pour ses prouesses en matière de clonage de voix et son API de synthèse vocale. Mais la société franchit aujourd’hui une étape supplémentaire en offrant la possibilité de construire des agents IA complets, capables de mener des conversations fluides et naturelles.
Grâce à la nouvelle plateforme développeur d’ElevenLabs, les utilisateurs peuvent personnaliser de nombreux paramètres pour façonner leur agent conversationnel idéal :
- Le ton de la voix
- La longueur des réponses
- La langue principale
- Le message d’accueil
Ils peuvent également choisir parmi différents grands modèles de langage (LLM) comme Gemini, GPT ou Claude, et ajuster des critères techniques tels que la température des réponses, les limites d’utilisation des tokens ou encore la latence.
Intégration transparente de bases de connaissances
L’un des principaux défis pour créer un agent IA pertinent est de l’alimenter avec les bonnes données. Sur ce point, ElevenLabs se démarque en permettant aux utilisateurs d’intégrer facilement leur propre base de connaissances, que ce soit via un fichier, une URL ou directement un bloc de texte.
Les développeurs ont aussi la possibilité de connecter leur propre LLM personnalisé à l’agent conversationnel. Et grâce au SDK compatible avec Python, JavaScript, React et Swift, ainsi qu’à l’API WebSocket, les options de personnalisation sont quasiment infinies.
Collecter des données et évaluer les conversations
ElevenLabs permet aux entreprises de définir des critères pour collecter certaines données lors des échanges avec les agents IA, comme le nom ou l’email des clients. Des critères d’évaluation en langage naturel peuvent également être mis en place pour juger de la réussite ou de l’échec d’une conversation.
Beaucoup de nos clients utilisaient déjà nos outils pour créer des agents conversationnels. Les parties les plus complexes étaient d’intégrer la base de connaissances et de gérer les interruptions. C’est pourquoi nous avons décidé de construire un pipeline complet.
– Sam Sklar, Responsable de la croissance chez ElevenLabs
De la synthèse vocale à la reconnaissance vocale
Pour proposer une expérience conversationnelle de bout en bout, ElevenLabs a dû développer ses propres capacités de reconnaissance vocale, ou « speech-to-text ». Une technologie qui n’est pour l’instant pas commercialisée de façon indépendante, mais qui pourrait l’être à l’avenir.
Si tel est le cas, ElevenLabs se positionnera comme un sérieux concurrent face aux géants du secteur comme Google, Microsoft, Amazon ou encore OpenAI avec son API Whisper, mais aussi face à des acteurs plus spécialisés comme AssemblyAI, Deepgram, Speechmatics ou Gladia.
Rivaliser avec OpenAI et lever des fonds
Avec ce nouveau produit d’agents IA, ElevenLabs affronte également OpenAI et son API conversationnelle en temps réel. Mais la startup est confiante et mise sur ses options de personnalisation avancées et la possibilité de basculer facilement entre différents modèles de langage pour faire la différence.
En parallèle, ElevenLabs cherche à lever de nouveaux fonds, avec l’objectif ambitieux d’atteindre une valorisation supérieure à 3 milliards de dollars. De quoi lui donner les moyens de ses ambitions pour démocratiser toujours plus la création d’agents conversationnels d’IA.
Source : ElevenLabs now offers ability to build conversational AI agents