Les Modèles d’IA de Raisonnement : Une Tendance en Plein Essor

MondeTech.fr14/12/2024

L’intelligence artificielle (IA) est en constante évolution, et les derniers développements dans le domaine des modèles de raisonnement suscitent beaucoup d’intérêt. Suite au lancement d’o1, le modèle de raisonnement d’OpenAI, de nombreux autres laboratoires d’IA se sont lancés dans la course pour développer leurs propres algorithmes de raisonnement. Mais cette tendance est-elle vraiment bénéfique pour l’industrie ?

Une explosion de modèles de raisonnement

En novembre dernier, plusieurs entreprises ont dévoilé leurs propres modèles de raisonnement. DeepSeek, une société de recherche en IA financée par des traders quantitatifs, a lancé un aperçu de son premier algorithme de raisonnement, DeepSeek-R1. L’équipe Qwen d’Alibaba a quant à elle présenté ce qu’elle affirme être le premier concurrent « ouvert » d’o1.

Cette effervescence s’explique en partie par la recherche de nouvelles approches pour affiner les technologies d’IA générative. Les techniques de « force brute » consistant à augmenter la taille des modèles ne donnent plus les améliorations escomptées. Les entreprises d’IA subissent une pression concurrentielle intense pour maintenir le rythme actuel d’innovation, le marché mondial de l’IA étant estimé à près de 2 000 milliards de dollars d’ici 2030.

Des modèles prometteurs mais coûteux

OpenAI affirme que les modèles de raisonnement peuvent « résoudre des problèmes plus difficiles » que les modèles précédents et représentent un changement majeur dans le développement de l’IA générative. Cependant, tout le monde n’est pas convaincu qu’il s’agisse de la meilleure voie à suivre.

Nous courons le risque de nous concentrer de manière myope sur un seul paradigme.
Ameet Talwalkar, professeur associé d’apprentissage automatique à Carnegie Mellon

Les modèles de raisonnement présentent en effet deux inconvénients majeurs : ils sont coûteux et gourmands en énergie. Par exemple, dans l’API d’OpenAI, l’entreprise facture 15 $ pour chaque tranche d’environ 750 000 mots analysés par o1 et 60 $ pour chaque tranche générée. C’est 3 à 4 fois plus cher que le dernier modèle « non raisonnant » d’OpenAI, GPT-4o.

Des limitations à surmonter

Au-delà du coût, les modèles de raisonnement actuels présentent d’autres limitations. Costa Huang, chercheur et ingénieur en apprentissage automatique chez Ai2, souligne qu’o1 n’est pas un calculateur très fiable. Des recherches rapides sur les réseaux sociaux révèlent également un certain nombre d’erreurs avec le mode o1 Pro.

Le vrai raisonnement fonctionne sur tous les problèmes, pas seulement sur ceux qui sont probables dans les données d’entraînement d’un modèle.
Guy Van Den Broeck, professeur d’informatique à UCLA

Selon Van den Broeck, les modèles actuels n’effectuent pas un véritable raisonnement et sont donc limités dans les types de tâches qu’ils peuvent réussir. Surmonter ce défi sera essentiel pour réaliser pleinement le potentiel de l’IA de raisonnement.

Un avenir prometteur mais incertain

Malgré ces défis, il est fort probable que les modèles de raisonnement s’améliorent avec le temps, étant donné les fortes incitations du marché. De nombreuses startups et investisseurs misent sur un avenir dominé par l’IA de raisonnement.

Cependant, certains craignent que les grands laboratoires ne gardent jalousement ces améliorations. Ameet Talwalkar s’inquiète du fait que le manque de transparence entrave la capacité de la communauté de recherche à s’engager dans ces idées. La plupart, sinon la totalité, des modèles seront probablement proposés par de grands laboratoires industriels comme OpenAI.

En conclusion, bien que les modèles de raisonnement suscitent beaucoup d’enthousiasme, il est important de rester réaliste quant à leurs capacités actuelles et aux défis à relever. L’avenir de l’IA de raisonnement est prometteur, mais le chemin pour y parvenir est encore long et incertain.