OpenAI Se Prépare à Lancer Son Nouvel Agent « Operator »

OpenAI, la société à l’origine du célèbre ChatGPT, serait sur le point de lancer un nouvel outil révolutionnaire baptisé « Operator ». Selon des fuites récentes, cet agent IA serait capable de prendre le contrôle de votre ordinateur et d’effectuer de manière autonome une multitude de tâches, du codage à la réservation de voyages.

Des Indices Qui Ne Trompent Pas

Tibor Blaho, ingénieur logiciel réputé pour ses révélations précises sur les futurs produits IA, affirme avoir découvert des preuves de l’arrivée imminente d’Operator. Des publications comme Bloomberg avaient déjà évoqué cet outil « agent » aux capacités impressionnantes. The Information cible même janvier comme mois de lancement.

Et les indices s’accumulent. Le client ChatGPT d’OpenAI pour macOS a gagné des options, encore cachées, pour « Activer Operator » et « Forcer l’arrêt d’Operator ». De plus, des références à Operator sont apparues sur le site d’OpenAI, bien que non visibles publiquement pour l’instant.

Des Performances Qui Impressionnent, Mais Pas Encore Parfaites

Le site d’OpenAI contiendrait aussi des tableaux comparant les performances d’Operator à celles d’autres systèmes IA. Si ces chiffres sont exacts, ils suggèrent qu’Operator n’est pas infaillible, selon la tâche.

Sur OSWorld, un benchmark simulant un véritable environnement informatique, « OpenAI Computer Use Agent (CUA) » – possiblement le modèle alimentant Operator – obtient un score de 38,1%, devant le modèle d’Anthropic mais loin derrière les 72,4% des humains. CUA surpasse les performances humaines sur WebVoyager, évaluant la capacité d’une IA à naviguer et interagir avec des sites web. Mais il est en deçà sur WebArena, un autre benchmark web.

Operator peine aussi sur des tâches qu’un humain réaliserait aisément. Lors d’un test lui demandant de s’inscrire chez un fournisseur cloud et de lancer une machine virtuelle, il n’a réussi que dans 60% des cas. Et pour la création d’un portefeuille Bitcoin, seulement 10% de succès.

Une Course Aux Agents IA Qui S’Accélère

L’arrivée imminente d’OpenAI sur le marché des agents IA intervient alors que des rivaux comme Anthropic, Google et d’autres se positionnent sur ce segment naissant. Bien que risqués et spéculatifs, les agents IA sont déjà présentés par les géants de la tech comme la prochaine grande révolution en matière d’intelligence artificielle. Analytics firm Markets and Markets estime que ce marché pourrait peser 47,1 milliards de dollars d’ici 2030.

La Sécurité, Un Enjeu Majeur

Si les agents IA actuels sont encore primitifs, certains experts s’inquiètent des risques qu’ils pourraient poser en cas d’amélioration rapide. Un des tableaux divulgués montre qu’Operator obtient de bons résultats sur des évaluations de sécurité, notamment des tests cherchant à lui faire réaliser des « activités illicites » ou rechercher des « données personnelles sensibles ». La sécurité serait d’ailleurs une des raisons du long cycle de développement d’Operator.

Je n’ose imaginer les réactions si OpenAI faisait une version similaire.

– Wojciech Zaremba, co-fondateur d’OpenAI, critiquant la sortie par Anthropic d’un agent qu’il juge dépourvu de garde-fous

Ironiquement, OpenAI a été critiqué par des chercheurs en IA, dont d’ex-employés, pour avoir prétendument délaissé le travail sur la sécurité au profit d’une commercialisation rapide de sa technologie.

En Résumé

  • OpenAI s’apprête à lancer Operator, un agent IA capable de contrôler un PC
  • Des fuites et indices confirment l’imminence de cette sortie
  • Operator impressionne sur certains benchmarks mais peine encore sur des tâches basiques
  • La course aux agents IA s’intensifie, avec un marché estimé à 47 milliards de dollars en 2030
  • La sécurité de ces systèmes autonomes inquiète certains experts

Operator pourrait bien marquer une nouvelle étape dans la démocratisation des agents IA, ces systèmes autonomes promis à un bel avenir. Mais au-delà de la prouesse technologique, les questions de fiabilité et surtout de sécurité devront être au cœur des préoccupations. Car si ces outils nous fascinent, ils soulèvent aussi des craintes légitimes qu’il faudra adresser.

À lire également