Dans la course effrénée vers l’IA de nouvelle génération, Google vient de dévoiler son propre modèle de « raisonnement » baptisé Gemini 2.0 Flash Thinking Experimental. Bien qu’encore à un stade précoce, cette avancée marque une étape importante dans la quête de l’IA pour maîtriser des tâches cognitives complexes.
Un modèle d’IA voué au raisonnement avancé
Disponible sur la plateforme AI Studio de Google, Gemini 2.0 Flash Thinking Experimental se démarque par ses capacités de compréhension multimodale, de raisonnement et de codage. Selon sa fiche descriptive, il serait en mesure de « raisonner sur les problèmes les plus complexes » dans des domaines tels que la programmation, les mathématiques et la physique.
Logan Kilpatrick, responsable produit chez AI Studio, qualifie ce modèle de « premier pas dans le voyage de raisonnement de Google ». Jeff Dean, scientifique en chef de Google DeepMind, la division de recherche en IA de Google, précise quant à lui que Gemini 2.0 Flash Thinking Experimental est « entraîné à utiliser des pensées pour renforcer son raisonnement ».
Nous voyons des résultats prometteurs lorsque nous augmentons le temps de calcul d’inférence.
Jeff Dean, scientifique en chef de Google DeepMind
Le fonctionnement des modèles de raisonnement
Basé sur le récent modèle Gemini 2.0 Flash de Google, Gemini 2.0 Flash Thinking Experimental semble similaire dans sa conception à GPT-4 d’OpenAI et à d’autres modèles dits de « raisonnement ». Contrairement à la plupart des IA, les modèles de raisonnement vérifient efficacement leurs propres faits, ce qui les aide à éviter certains des écueils qui trompent normalement les modèles d’IA.
Lorsqu’on lui soumet une question, Gemini 2.0 Flash Thinking Experimental marque une pause avant de répondre, considérant un certain nombre de questions connexes et « expliquant » son raisonnement au fur et à mesure. Au bout d’un moment, le modèle résume ce qu’il considère comme la réponse la plus précise.
Des résultats mitigés lors des premiers tests
Cependant, lors de nos brefs essais, force est de constater qu’il y a certainement matière à amélioration. Par exemple, lorsqu’on lui a demandé combien de « R » se trouvaient dans le mot « strawberry », Gemini 2.0 Flash Thinking Experimental a répondu « deux ».
Bien sûr, les résultats peuvent varier selon les questions posées. Mais cela souligne le fait que même si ces modèles de raisonnement représentent une avancée significative, ils restent encore loin d’être infaillibles.
Une course effrénée vers l’IA de raisonnement
Depuis la sortie de GPT-4, on assiste à une véritable explosion de modèles de raisonnement sortis par les laboratoires d’IA concurrents, et pas seulement chez Google :
- Début novembre, DeepSeek, une société de recherche en IA financée par des traders quantitatifs, a lancé un aperçu de son premier modèle de raisonnement, DeepSeek-R1.
- Le même mois, l’équipe Qwen d’Alibaba a dévoilé ce qu’elle prétend être le premier concurrent « ouvert » de GPT-4.
Selon des rapports de Bloomberg et The Information, Google aurait au moins 200 chercheurs se concentrant sur cette technologie, répartis dans plusieurs équipes.
A la recherche de nouvelles approches de l’IA générative
Cet engouement pour les modèles de raisonnement s’explique notamment par la quête de nouvelles approches pour affiner l’IA générative. En effet, comme le rapportait récemment mon collègue Max Zeff, les techniques de « force brute » consistant à augmenter la taille des modèles ne produisent plus les améliorations qu’elles produisaient autrefois.
Cependant, tout le monde n’est pas convaincu que les modèles de raisonnement sont la meilleure voie à suivre :
- Ils ont tendance à être coûteux, en raison de la grande quantité de puissance de calcul nécessaire pour les faire fonctionner.
- Bien qu’ils aient jusqu’à présent obtenu de bons résultats sur les benchmarks, il n’est pas certain que les modèles de raisonnement puissent maintenir ce rythme de progrès.
Quoi qu’il en soit, la sortie de Gemini 2.0 Flash Thinking Experimental démontre que Google est déterminé à rester à la pointe de la recherche sur l’IA de raisonnement. Reste à voir si ce modèle expérimental saura tenir ses promesses et ouvrir la voie à une nouvelle génération d’IA cognitives.