Dans un monde où la consommation de contenu audio explose, les plateformes cherchent à produire toujours plus vite et à moindre coût. C’est dans ce contexte que Pocket FM, soutenu par Lightspeed Ventures, vient d’annoncer un partenariat innovant avec la startup de clonage vocal ElevenLabs. Leur objectif : convertir des scripts en séries audio grâce à l’intelligence artificielle, de manière ultra-rapide et économique.
Une production audio boostée et des coûts réduits
Grâce à cette collaboration, Pocket FM a déjà réussi à générer 30 000 heures de séries audio lors de sa phase de test. La plateforme prévoit désormais de tripler son catalogue, qui compte déjà plus de 100 000 heures de contenu audio, d’ici la fin de l’année. Mais le plus impressionnant reste la réduction des coûts de production, qui atteindraient les 90% !
Même avec un bon équipement et une configuration optimale, les écrivains ne peuvent produire qu’environ 30 minutes de contenu audio de qualité par jour. Avec les outils d’IA, ce rendement peut être multiplié par 10.
– Prateek Dixit, co-fondateur et CTO de Pocket FM
Une technologie vocale toujours plus réaliste
La technologie d’ElevenLabs permet de générer des voix de synthèse d’un réalisme bluffant. Leur outil est capable de comprendre le contexte d’un texte et d’inférer les émotions appropriées automatiquement. Pocket FM propose ainsi à ses 250 000 écrivains un choix de 50 voix différentes pour convertir leurs écrits en audio.
En collaborant avec Pocket FM, nous déployons nos modèles les plus récents, qui comprennent mieux le genre d’écriture et restituent encore mieux les émotions.
– Mati Staniszewski, co-fondateur d’ElevenLabs
Quel impact pour les artistes ?
Si cette avancée technologique offre des perspectives enthousiasmantes pour les plateformes audio en termes de productivité, elle soulève aussi des inquiétudes chez les artistes. L’Association of Voiceover Artists en Inde craint notamment que l’IA ne réduise drastiquement les opportunités pour les comédiens de doublage.
- Certains artistes s’inquiètent d’une perte de connexion émotionnelle avec un contenu généré par IA
- D’autres craignent une standardisation des voix et des contenus
- La question de la juste rémunération des artistes dont la voix sert à entraîner les IA se pose également
Pourtant, Pocket FM assure que l’engagement des auditeurs avec le contenu généré par IA lors de ses tests était aussi bon qu’avec les productions réalisées par des artistes. La plateforme travaille même sur une technologie permettant d’intégrer plusieurs voix dans un même contenu audio.
Une tendance de fond qui va s’accélérer
Pocket FM est loin d’être la seule plateforme audio à miser sur l’IA générative. Son concurrent indien Kuku FM expérimente déjà plusieurs outils comme GPT-4, Claude ou Midjourney pour aider ses écrivains à différentes étapes de la création. Tout porte à croire que cette tendance va continuer de s’accélérer dans les mois à venir.
Reste à trouver le juste équilibre entre les formidables opportunités offertes par ces technologies et le nécessaire respect du travail des artistes. Un défi de taille pour toute l’industrie du contenu audio.