Google Lance une Technologie de Filigranage pour les Textes Générés par IA

MondeTech.fr23/10/2024

Dans un contexte où les contenus générés par l’IA se multiplient à une vitesse vertigineuse, Google franchit un pas important en mettant à disposition des développeurs et entreprises sa technologie de filigranage des textes issus de l’intelligence artificielle. Baptisée SynthID Text, cet outil open source promet d’aider à identifier les contenus créés par des modèles génératifs, ouvrant ainsi la voie à plus de transparence et de responsabilité dans l’utilisation de l’IA.

Un filigrane invisible pour tracer les textes IA

Le fonctionnement de SynthID Text repose sur une approche astucieuse. Lorsqu’un modèle génère du texte à partir d’une invite, il prédit et assigne un score de probabilité à chaque « token » (mot, caractère ou partie de phrase) susceptible de suivre le précédent. SynthID Text insère alors des données supplémentaires dans cette distribution de tokens en modulant subtilement leurs scores. Cette séquence de scores modifiés constitue le filigrane qui permettra par la suite de détecter si un texte provient ou non d’un outil d’IA.

Disponible gratuitement pour les développeurs et les entreprises, SynthID Text les aidera à identifier leurs contenus générés par IA.
– Google

Selon Google, cette technologie utilisée en interne depuis le printemps sur ses modèles Gemini n’altère en rien la qualité, la précision ou la vitesse de génération des textes. Mieux encore, le filigrane resterait détectable même si le texte est ensuite tronqué, paraphrasé ou modifié.

Des limitations à prendre en compte

Cependant, Google reconnaît que SynthID Text présente certaines limites :

Performances réduites sur les textes courts ou traduits depuis une autre langue
Difficulté à filigrane les réponses factuelles sans affecter leur exactitude
Moins efficace sur les réponses à des questions précises où peu de variations sont attendues

Vers une adoption généralisée du filigranage ?

Google n’est pas seul sur ce créneau. OpenAI planche depuis des années sur des méthodes de filigranage, sans toutefois les avoir rendues publiques à ce jour pour des raisons à la fois techniques et commerciales. L’enjeu est de taille car ces techniques, si elles sont largement adoptées, pourraient contribuer à endiguer la vague de « détecteurs d’IA » souvent peu fiables qui se multiplient.

Reste à savoir si le filigranage s’imposera comme un standard et si une technologie en particulier réussira à faire consensus. Des pressions réglementaires pourraient accélérer le mouvement, à l’image de la Chine qui a introduit le filigranage obligatoire des contenus IA, une mesure à l’étude également en Californie.

Une urgence face à la déferlante des contenus synthétiques

L’enjeu est crucial alors qu’un rapport de l’Agence européenne de police prévoit que 90% des contenus en ligne pourraient être générés par l’IA dès 2026, avec son lot de défis en termes de désinformation, propagande, fraude et tromperie. Dans ce contexte, les initiatives comme SynthID Text apparaissent plus que jamais nécessaires pour maintenir la confiance et la traçabilité dans l’écosystème numérique.

Avec sa solution open source, Google ouvre la voie à une démocratisation des technologies de filigranage. Aux développeurs et entreprises désormais de s’en emparer pour favoriser un usage plus transparent et responsable de l’IA générative dans la production de contenus.