Pourquoi ChatGPT est-il si mauvais en mathématiques ?

MondeTech.fr03/10/2024

Vous avez certainement remarqué que les IA comme ChatGPT, aussi impressionnantes soient-elles dans de nombreux domaines, ont un point faible surprenant : les mathématiques. Simples additions, multiplications ou même équations du second degré semblent poser problème à ces modèles de langage pourtant si avancés. Comment expliquer ce paradoxe ?

La tokenisation, une arme à double tranchant

L’une des raisons principales se cache dans le processus de tokenisation. Cette méthode, qui consiste à découper les données en petits morceaux appelés tokens, permet aux IA d’encoder efficacement l’information. Mais les tokeniseurs ne comprenant pas réellement ce que sont les nombres, ils finissent souvent par détruire les relations entre les chiffres.

Par exemple, un tokeniseur pourrait traiter le nombre « 380 » comme un seul token mais représenter « 381 » comme une paire de chiffres (« 38 » et « 1 »).

Des machines statistiques avant tout

Mais la tokenisation n’est pas la seule raison pour laquelle les maths sont le talon d’Achille des IA. Ces systèmes sont avant tout des machines statistiques. Entraînés sur de nombreux exemples, ils en apprennent les modèles pour faire des prédictions.

Prenons le problème de multiplication 5,7897 x 1,2832. ChatGPT, ayant vu de nombreux problèmes similaires, en déduira probablement que le produit d’un nombre se terminant par « 7 » et d’un nombre se terminant par « 2 » finira par « 4 ». Mais il aura du mal avec la partie centrale.

Des progrès encourageants

Malgré ces limitations, il y a de l’espoir. Des chercheurs comme Yuntian Deng de l’Université de Waterloo ont étudié en détail les capacités mathématiques de ChatGPT. Ils ont constaté que le nouveau modèle « raisonnant », o1, résout beaucoup mieux certains types de problèmes comme les multiplications de grands nombres.

Le modèle pourrait résoudre les problèmes d’une manière différente de notre approche manuelle. Cela nous rend curieux de son approche interne et de sa différence avec le raisonnement humain.
– Yuntian Deng, Université de Waterloo

Selon Deng, ces progrès indiquent qu’au moins certains types de problèmes mathématiques, comme les multiplications, seront à terme « entièrement résolus » par des systèmes comme ChatGPT. Avec des algorithmes connus et des améliorations significatives déjà observées, il est clair que les capacités de raisonnement des IA progressent.

Un long chemin à parcourir

Malgré ces avancées prometteuses, les IA ont encore beaucoup de progrès à faire en mathématiques pour rivaliser avec les humains ou même une simple calculatrice. Leurs faiblesses sur des concepts de base comme les fractions ou les équations montrent l’étendue du défi.

Les IA peinent encore avec les calculs élémentaires
La compréhension profonde des concepts mathématiques leur fait défaut
Elles doivent apprendre à raisonner de manière plus structurée

Néanmoins, les progrès rapides de ces dernières années laissent entrevoir un avenir prometteur. Avec des modèles comme o1 qui commencent à « penser » étape par étape, les IA pourraient un jour maîtriser les mathématiques aussi bien que le langage. D’ici là, mieux vaut garder sa calculatrice à portée de main !