Imaginez un instant qu’une Intelligence Artificielle puisse résoudre des problèmes mathématiques complexes mieux que les plus brillants cerveaux humains. C’est exactement ce que DeepMind, le laboratoire d’IA de Google, affirme avoir réalisé avec son système AlphaGeometry2. Selon une étude récemment publiée, cette IA serait capable de résoudre 84% des problèmes de géométrie posés lors des Olympiades Internationales de Mathématiques (IMO) au cours des 25 dernières années, surpassant ainsi la moyenne des médaillés d’or.
AlphaGeometry2 : Un Système IA Hybride Révolutionnaire
AlphaGeometry2 est une version améliorée d’AlphaGeometry, un système IA que DeepMind avait dévoilé en janvier dernier. Sa particularité réside dans son approche hybride, combinant un modèle de langage neuronal de la famille Gemini de Google et un moteur symbolique basé sur des règles. Le modèle Gemini suggère des étapes et des constructions dans un langage mathématique formel, tandis que le moteur symbolique vérifie la cohérence logique de ces étapes en suivant des règles spécifiques.
Des Performances Exceptionnelles Aux Olympiades Mathématiques
Pour tester les capacités d’AlphaGeometry2, l’équipe de DeepMind a sélectionné 45 problèmes de géométrie des compétitions IMO des 25 dernières années (de 2000 à 2024). Ces problèmes ont été « traduits » en un ensemble plus large de 50 problèmes. Résultat : AlphaGeometry2 a résolu 42 des 50 problèmes, dépassant le score moyen des médaillés d’or qui est de 40,9.
Il est frappant de voir le contraste entre les progrès spectaculaires et continus sur ce type de tests, et pendant ce temps, les modèles de langage, y compris les plus récents dotés de « raisonnement », qui continuent à peiner sur certains problèmes simples de bon sens.
– Vince Conitzer, Professeur d’informatique à l’Université Carnegie Mellon, spécialisé dans l’IA
Vers Une IA Généralisable Grâce Aux Approches Hybrides ?
Si AlphaGeometry2 impressionne par ses performances, il soulève également des questions quant à l’avenir de l’IA. Les chercheurs de DeepMind pensent que la clé d’une IA plus capable pourrait résider dans la découverte de nouvelles façons de résoudre des problèmes géométriques complexes. Ces compétences en résolution de problèmes pourraient s’avérer être un élément utile pour les futurs modèles d’IA à usage général.
Les résultats d’AlphaGeometry2 semblent démontrer que la combinaison de la manipulation de symboles et des réseaux neuronaux est une voie prometteuse dans la recherche d’une IA généralisable. Cependant, l’équipe de DeepMind a également trouvé des preuves préliminaires que le modèle de langage d’AlphaGeometry2 était capable de générer des solutions partielles aux problèmes sans l’aide du moteur symbolique.
Les résultats soutiennent l’idée que les grands modèles de langage peuvent être autosuffisants sans dépendre d’outils externes [comme les moteurs symboliques], mais jusqu’à ce que la vitesse [du modèle] soit améliorée et que les hallucinations soient complètement résolues, les outils resteront essentiels pour les applications mathématiques.
– L’équipe DeepMind dans leur étude
Les Limites Et Perspectives D’AlphaGeometry2
Malgré ses prouesses, AlphaGeometry2 présente certaines limites. Une particularité technique l’empêche de résoudre les problèmes comportant un nombre variable de points, des équations non linéaires et des inégalités. De plus, sur un ensemble de problèmes IMO plus difficiles, AlphaGeometry2 n’a pu en résoudre que 20 sur 29.
Néanmoins, ces résultats ouvrent de nouvelles perspectives passionnantes. Au-delà de la géométrie, ces approches pourraient être étendues à d’autres domaines des mathématiques et des sciences, par exemple pour aider à des calculs d’ingénierie complexes. AlphaGeometry2 représente ainsi une avancée majeure dans le développement d’IA capables de raisonnement mathématique avancé, nous rapprochant peut-être un peu plus d’une véritable intelligence artificielle générale.