Le prompt engineering est devenu un métier en vogue l’an dernier dans l’industrie de l’IA, mais il semblerait qu’Anthropic développe maintenant des outils pour l’automatiser au moins partiellement. La startup a dévoilé mardi plusieurs nouvelles fonctionnalités pour aider les développeurs à créer des applications plus utiles avec son modèle de langage, Claude, selon un billet de blog de l’entreprise.
Les développeurs peuvent désormais utiliser Claude 3.5 Sonnet pour générer, tester et évaluer des prompts, en utilisant des techniques de prompt engineering pour créer de meilleures entrées et améliorer les réponses de Claude pour des tâches spécialisées. Bien que les modèles de langage soient assez tolérants lorsqu’on leur demande d’effectuer certaines tâches, de petits changements dans la formulation d’un prompt peuvent parfois conduire à de grandes améliorations dans les résultats.
Normalement, il faudrait trouver soi-même cette formulation, ou embaucher un prompt engineer pour le faire, mais cette nouvelle fonctionnalité offre un retour rapide qui pourrait faciliter la recherche d’améliorations. Les fonctionnalités sont hébergées dans Anthropic Console sous un nouvel onglet Evaluate. Console est le laboratoire d’essai de la startup pour les développeurs, créé pour attirer les entreprises cherchant à construire des produits avec Claude.
Un générateur de prompt intégré
L’une des fonctionnalités, dévoilée en mai, est le générateur de prompt intégré d’Anthropic ; il prend une courte description d’une tâche et construit un prompt beaucoup plus long et étoffé, en utilisant les propres techniques de prompt engineering d’Anthropic. Si les outils d’Anthropic ne remplaceront peut-être pas complètement les prompt engineers, l’entreprise a déclaré qu’ils aideraient les nouveaux utilisateurs et feraient gagner du temps aux prompt engineers expérimentés.
Dans Evaluate, les développeurs peuvent tester l’efficacité des prompts de leur application d’IA dans divers scénarios. Ils peuvent télécharger des exemples réels dans une suite de tests ou demander à Claude de générer un éventail de cas de test générés par l’IA. Les développeurs peuvent ensuite comparer côte à côte l’efficacité de différents prompts et noter les réponses types sur une échelle de cinq points.
Identifier et corriger rapidement les faiblesses
Dans un exemple tiré du billet de blog d’Anthropic, un développeur a identifié que son application donnait des réponses trop courtes dans plusieurs cas de test. Le développeur a pu modifier une ligne dans son prompt pour allonger les réponses, et l’appliquer simultanément à tous ses cas de test. Cela pourrait faire gagner beaucoup de temps et d’efforts aux développeurs, en particulier à ceux qui n’ont que peu ou pas d’expérience en prompt engineering.
Passer 30 minutes avec un prompt engineer peut souvent faire fonctionner une application qui ne fonctionnait pas auparavant.
Dario Amodei, PDG et cofondateur d’Anthropic
Selon Dario Amodei, le prompt engineering est l’un des éléments les plus importants pour une large adoption de l’IA générative par les entreprises. Avec ces nouveaux outils, Anthropic espère faciliter et démocratiser cette pratique cruciale, permettant à plus d’entreprises de tirer parti de la puissance de l’IA.
Vers une démocratisation du promptage ?
Si ces outils tiennent leurs promesses, ils pourraient bien marquer un tournant dans l’utilisation de l’IA par les entreprises. En rendant le prompt engineering plus accessible et plus efficace, Anthropic ouvre la voie à une adoption plus large de l’IA générative, y compris par des entreprises qui n’ont pas les ressources pour embaucher des prompt engineers dédiés.
Reste à voir si ces outils seront suffisamment puissants et intuitifs pour réellement démocratiser le promptage. Mais une chose est sûre : avec cette annonce, Anthropic confirme son ambition de devenir un acteur majeur de l’IA générative pour les entreprises, en proposant non seulement un modèle de langage performant avec Claude, mais aussi tout un écosystème d’outils pour en tirer le meilleur parti.
Les prochains mois nous diront si cette stratégie porte ses fruits, et si Anthropic parvient à s’imposer face à des géants comme OpenAI ou Google dans la course à l’IA générative pour les entreprises. Mais avec ces nouveaux outils de promptage, la startup se donne en tout cas les moyens de ses ambitions.