Dans une annonce qui a suscité l’intérêt du monde de l’IA, Tim Brooks, l’un des co-leads du projet de générateur vidéo Sora chez OpenAI, a révélé qu’il quittait l’entreprise pour rejoindre Google DeepMind. Brooks, qui dirigeait le développement de Sora aux côtés de William Peebles, a déclaré sur X (anciennement Twitter) qu’il allait travailler sur des technologies de génération vidéo et des « simulateurs de mondes » chez DeepMind, la division de recherche en IA de Google.
J’ai passé deux années incroyables chez OpenAI à créer Sora. Merci à toutes les personnes passionnées et bienveillantes avec qui j’ai travaillé.
– Tim Brooks
Un Rêve De Longue Date Devenu Réalité
Le PDG de Google DeepMind, Demis Hassabis, a accueilli Brooks dans une réponse sur X, déclarant qu’il aidera à « faire du rêve de longue date d’un simulateur de monde une réalité ». Le terme « simulateur de monde » est assez vague et mal défini, mais DeepMind l’a appliqué à des modèles comme son Genie récemment publié, qui peut générer des mondes virtuels jouables et contrôlables à partir d’images synthétisées, de photos réelles et même de croquis.
Les applications d’un simulateur du monde réel vont de la création de contenu contrôlable dans les jeux et les films à la formation d’agents incarnés purement en simulation qui peuvent être déployés directement dans le monde réel.
– Des chercheurs de DeepMind en 2023
Un Pionnier De Sora
Brooks a été l’un des premiers chercheurs à travailler sur Sora. Il a contribué à lancer le projet chez OpenAI en janvier 2023. Sur son profil LinkedIn, Brooks affirme avoir dirigé la direction de recherche du projet et la formation des grands modèles.
Son départ intervient alors que Sora, qui n’a pas encore été publié, souffre apparemment de revers techniques qui le placent mal face aux systèmes rivaux de Luma, Runway et autres. Selon The Information, le système original, révélé en février, prenait plus de 10 minutes de traitement pour réaliser un clip vidéo d’une minute.
La Concurrence S’Intensifie
Google dispose de son propre modèle de génération vidéo, Veo, qu’il a dévoilé ce printemps lors de sa conférence annuelle des développeurs I/O, et qui arrivera bientôt sur YouTube Shorts, le format vidéo court de YouTube, pour permettre aux créateurs de générer des arrière-plans et des clips de six secondes.
Outre les obstacles techniques, OpenAI semble avoir cédé du terrain en termes de partenariats précieux aux concurrents de la génération vidéo ces derniers mois :
- Début septembre, Runway a signé un accord avec Lionsgate, le studio derrière la franchise « John Wick », pour former un modèle vidéo personnalisé sur le catalogue de films de Lionsgate.
- Environ une semaine plus tard, Stability, qui développe son propre ensemble de modèles de génération vidéo, a recruté le réalisateur James Cameron (« Avatar », « Terminator », « Titanic ») dans son conseil d’administration.
OpenAI aurait rencontré des cinéastes et des studios hollywoodiens plus tôt cette année pour faire la démonstration de Sora, et l’entreprise s’est associée à un certain nombre de réalisateurs indépendants et de marques pour mettre en valeur les capacités du système. Cependant, OpenAI n’a pas encore annoncé de collaboration à long terme avec une grande maison de production.
Un Exode Des Talents Chez OpenAI
Brooks est le dernier d’une série de démissions de haut niveau chez OpenAI :
- La CTO Mira Murati, le directeur de la recherche Bob McGrew et le vice-président de la recherche Barret Zoph ont annoncé leur départ fin septembre.
- Andrej Karpathy, éminent chercheur, a quitté OpenAI en février ; des mois plus tard, le cofondateur et ancien directeur scientifique Ilya Sutskever a démissionné, ainsi que l’ancien responsable de la sécurité Jan Leike.
- En août, le cofondateur John Schulman a déclaré qu’il allait quitter OpenAI.
- Greg Brockman, le président de l’entreprise, est en congé sabbatique.
Le départ de Brooks pour Google est un coup dur pour OpenAI, mais une aubaine pour DeepMind. Avec son expertise en génération vidéo et en simulation de mondes, Brooks est bien placé pour faire progresser les ambitions de DeepMind dans ces domaines clés de l’IA générative. Cependant, avec la concurrence qui s’intensifie et les défis techniques qui persistent, il reste à voir qui sortira vainqueur dans la course à la génération vidéo par IA.