Google fait un pas de géant vers l’intelligence artificielle générale avec la création d’une nouvelle équipe au sein de DeepMind. Leur mission : développer des modèles d’IA capables de simuler le monde physique de manière ultra-réaliste. Une avancée qui promet de révolutionner de nombreux domaines, de la robotique aux jeux vidéo en passant par le cinéma d’animation.
DeepMind à la pointe de la simulation 3D
La nouvelle équipe sera dirigée par Tim Brooks, l’un des co-leaders du générateur vidéo Sora chez OpenAI avant de rejoindre DeepMind en octobre. Leur objectif est de créer des modèles d’IA massifs capables de simuler le monde physique en s’appuyant sur les projets existants de Google comme Gemini pour l’analyse d’images et la génération de texte, Veo pour la génération vidéo et surtout Genie, capable de générer des mondes 3D jouables en temps réel.
Nous pensons que la mise à l’échelle de l’entraînement de l’IA sur des données vidéo et multimodales est sur le chemin critique vers l’intelligence artificielle générale.
– Job description de l’équipe de Tim Brooks
De nombreuses applications à la clé
Les modèles de simulation du monde physique, aussi appelés « world models », ouvrent un vaste champ d’applications :
- Création de médias interactifs (jeux vidéo, films…)
- Simulations réalistes pour entraîner des robots
- Raisonnement visuel et planification pour les agents autonomes
Des startups comme World Labs de Fei-Fei Lee ou Odyssey se positionnent déjà sur ce créneau prometteur. Mais l’arrivée d’un géant comme Google dans la course pourrait bien changer la donne.
Quel impact sur les industries créatives ?
Si ces technologies offrent des perspectives enthousiasmantes, elles soulèvent aussi des inquiétudes chez les créatifs. Des studios de jeux vidéo comme Activision Blizzard utilisent déjà l’IA pour gagner en productivité malgré les licenciements massifs. Selon une étude, plus de 100 000 emplois seraient menacés par l’IA dans le cinéma et l’animation aux États-Unis d’ici 2026.
Certaines startups comme Odyssey promettent de collaborer avec les professionnels plutôt que de les remplacer. Reste à voir quelle approche adoptera Google. Sans oublier l’épineuse question du droit d’auteur, alors que certains modèles semblent entraînés sur des vidéos de jeux sans licence.
Google, propriétaire de YouTube, affirme avoir la permission d’entraîner ses modèles sur les vidéos de la plateforme conformément aux conditions d’utilisation. Mais l’entreprise n’a pas précisé quelles vidéos spécifiques sont utilisées.
Vers une intelligence artificielle générale ?
Au-delà des enjeux éthiques et juridiques, les avancées de Google et d’autres acteurs dans la simulation du monde physique par l’IA nous rapprochent un peu plus de l’intelligence artificielle générale (AGI). C’est-à-dire une IA capable d’accomplir n’importe quelle tâche intellectuelle comme un humain.
Avec des modèles capables d’interagir avec des environnements complexes en temps réel, de générer des mondes crédibles et d’aider à la prise de décision, on entrevoit la possibilité de créer à terme des systèmes dotés d’une véritable compréhension du monde, voire d’une forme de créativité ou de conscience.
Les world models développés par Google et d’autres nous ouvrent une fenêtre fascinante sur le futur de l’intelligence artificielle. Un futur à la fois plein de promesses et de défis à relever pour en faire un outil au service de l’humanité.