Dans une initiative passionnante, Meta, la société mère de Facebook et Instagram, lance un nouveau programme en partenariat avec l’UNESCO pour collecter des enregistrements vocaux et des transcriptions. L’objectif ? Développer une intelligence artificielle de reconnaissance vocale et de traduction open source capable de comprendre et de traiter une grande variété de langues, y compris celles qui sont actuellement sous-représentées dans le domaine de l’IA.
Un appel à la diversité linguistique
Le Programme de Partenariat Technologique Linguistique de Meta recherche des collaborateurs pouvant fournir plus de 10 heures d’enregistrements vocaux avec transcriptions, de grandes quantités de texte écrit et des ensembles de phrases traduites dans diverses langues. Les partenaires travailleront main dans la main avec les équipes d’IA de Meta pour intégrer ces langues dans des modèles de reconnaissance vocale et de traduction, qui seront ensuite mis à disposition en open source une fois finalisés.
Notre objectif est de créer des systèmes intelligents capables de comprendre et de répondre à des besoins humains complexes, quelle que soit la langue ou le contexte culturel.
– Meta, dans un billet de blog
Parmi les premiers partenaires figure le gouvernement du Nunavut, un territoire peu peuplé du nord du Canada où certains résidents parlent des langues inuites collectivement appelées Inuktut. Cette collaboration illustre parfaitement la volonté de Meta de se concentrer sur les langues sous-représentées, en soutien au travail de l’UNESCO en faveur de la diversité linguistique.
Un benchmark pour évaluer les modèles de traduction
Parallèlement à ce nouveau programme, Meta annonce la sortie d’un benchmark open source pour évaluer les performances des modèles de traduction automatique. Composé de phrases élaborées par des linguistes, ce benchmark prend en charge sept langues et est accessible sur la plateforme de développement d’IA Hugging Face. Les chercheurs sont encouragés à l’utiliser et à y contribuer pour faire progresser l’état de l’art.
Des enjeux qui dépassent la philanthropie
Si Meta présente ces initiatives sous un angle philanthropique, l’entreprise a tout intérêt à améliorer ses modèles de reconnaissance vocale et de traduction. Son assistant IA, Meta AI, prend en charge un nombre croissant de langues. Des fonctionnalités comme la traduction automatique des publications des créateurs sont également en phase de test, comme un outil pour traduire les voix dans les Reels Instagram.
Cependant, le traitement par Meta des contenus dans d’autres langues que l’anglais sur ses plateformes a fait l’objet de nombreuses critiques. Des rapports ont montré que la désinformation liée au COVID en italien et en espagnol était beaucoup moins souvent signalée qu’en anglais. Des documents internes ont aussi révélé que des publications en arabe étaient régulièrement marquées à tort comme discours haineux.
Face à ces défis, Meta affirme prendre des mesures pour améliorer ses technologies de traduction et de modération. Le Programme de Partenariat Technologique Linguistique et le nouveau benchmark représentent des pas importants dans cette direction. En travaillant main dans la main avec des partenaires locaux et en favorisant l’open source, Meta espère construire des systèmes d’IA plus inclusifs et performants, au service d’une communication universelle qui transcende les barrières de la langue.
- Un programme pour collecter des données linguistiques diverses
- Des modèles d’IA de traduction et de reconnaissance vocale open source
- Un benchmark pour évaluer les performances des modèles de traduction
- Des enjeux de modération de contenu multilingue
Reste à voir si ces initiatives permettront à Meta de relever les défis liés au traitement équitable des langues sur ses plateformes. Une chose est sûre : en s’attaquant à la diversité linguistique, l’entreprise ouvre la voie vers une IA plus inclusive et universelle.