Alors que l’intelligence artificielle ne cesse de progresser à une vitesse fulgurante, la question de savoir comment mesurer ses capacités devient de plus en plus pressante. Récemment, Sam Altman, PDG d’OpenAI, a déclaré avoir observé une amélioration rapide du « QI » de l’IA ces dernières années. Mais le quotient intellectuel est-il vraiment un bon indicateur pour évaluer les prouesses de l’IA ?
Le QI, une mesure relative et limitée de l’intelligence humaine
Bien que largement utilisés, les tests de QI ne sont pas une mesure objective de l’intelligence. Ils évaluent principalement les capacités de raisonnement logique et abstrait, mais ne prennent pas en compte l’intelligence pratique, c’est-à-dire la capacité à résoudre des problèmes concrets. De plus, les résultats peuvent varier dans le temps et sont influencés par les normes culturelles occidentales.
Le QI est un outil pour mesurer les capacités humaines – un outil contesté, qui plus est – basé sur ce que les scientifiques pensent que l’intelligence humaine est. Mais vous ne pouvez pas utiliser la même mesure pour décrire les capacités de l’IA.
– Sandra Wachter, chercheuse à Oxford
L’IA a un avantage déloyal sur les tests de QI
Contrairement aux humains, l’IA dispose d’une mémoire quasi-infinie et de connaissances internalisées massives. Les modèles d’IA sont souvent entraînés sur d’énormes quantités de données provenant du web, qui contient de nombreux exemples de questions tirées de tests de QI. Ils ont donc un avantage certain sur ce type d’exercices répétitifs.
- L’IA a une mémoire et des connaissances quasi-illimitées
- Les modèles sont entraînés sur des données contenant des questions de tests de QI
- Contrairement aux humains, l’IA traite l’information sans perte de signal
Le besoin de nouveaux benchmarks adaptés à l’IA
Les tests de QI ont été conçus pour les humains, afin d’évaluer leurs capacités générales de résolution de problèmes. Mais l’IA fonctionne de manière très différente. Comparer directement ses performances à celles des humains soulève de nombreuses questions éthiques et pratiques. Il est donc crucial de développer de nouveaux benchmarks spécifiquement adaptés pour mesurer les capacités de l’IA de manière pertinente et équitable.
Dans l’histoire de l’informatique, nous n’avons jamais comparé les capacités de calcul à celles des humains précisément parce que la nature du calcul signifie que les systèmes ont toujours été capables d’accomplir des tâches déjà au-delà des capacités humaines.
– Heidy Khlaaf, scientifique en chef IA à l’AI Now Institute
En conclusion, bien que tentant, utiliser le QI comme mesure des progrès de l’IA semble inapproprié et trompeur. Le développement de nouveaux benchmarks prenant en compte les spécificités de l’intelligence artificielle apparaît essentiel pour évaluer ses capacités de manière pertinente et éthique. Un défi de taille pour les chercheurs, à l’heure où l’IA ne cesse de repousser les limites de ce que nous pensions possible.