Le terme « IA open source » est sur toutes les lèvres, mais sa signification précise soulève de nombreuses questions. Alors que les géants de la tech comme Meta brandissent fièrement l’étendard de l’IA open source, certains experts remettent en question la légitimité de cette appellation. Face à ce débat grandissant, l’Open Source Initiative (OSI) s’efforce de clarifier ce concept émergent.
L’IA est-elle vraiment comme le code logiciel ?
La première difficulté réside dans la nature même de l’IA. Contrairement au code logiciel traditionnel, les poids des réseaux de neurones qui sous-tendent les modèles d’IA ne sont pas directement lisibles ou modifiables par l’homme. Cette différence fondamentale remet en question la pertinence d’appliquer les principes de l’open source à l’IA de la même manière qu’au code.
Le cas épineux de Meta et Llama
L’exemple récent de Meta illustre bien ces tensions. Bien que l’entreprise ait qualifié ses modèles Llama d’open source, certaines restrictions d’utilisation ont suscité le scepticisme. Comme le souligne Stefano Maffulli, directeur exécutif de l’OSI, même au sein de Meta, beaucoup reconnaissent que le terme est utilisé de manière un peu abusive.
Tout le monde s’accorde à dire que Llama lui-même ne peut être considéré comme open source.
– Stefano Maffulli, directeur exécutif de l’Open Source Initiative
Vers une définition de l’IA open source
Face à ces enjeux, l’OSI travaille d’arrache-pied pour établir une définition claire de l’IA open source. Leur approche se fonde sur plusieurs principes clés :
- Liberté d’utiliser le système sans demander d’autorisation
- Possibilité d’étudier le fonctionnement du système et d’inspecter ses composants
- Droit de modifier et de partager le système à n’importe quelle fin
Mais un défi majeur subsiste : celui des données d’entraînement. Pour l’OSI, plutôt que d’exiger un accès complet aux jeux de données, souvent irréaliste, il est plus important de connaître leur provenance et les traitements effectués. La transparence sur le code d’assemblage des données est jugée essentielle.
Reproductibilité et ouverture, maîtres-mots de l’IA open source
En fin de compte, un système d’IA open source devrait être facilement réplicable, grâce à des instructions claires. C’est là que le Model Openness Framework, un système de classification de l’ouverture des modèles d’IA, entre en jeu. Il exige que des composants spécifiques du développement des modèles, comme les méthodologies d’entraînement, soient inclus et publiés sous des licences ouvertes appropriées.
Vers une « version stable » de la définition
L’OSI compte finaliser sa définition de l’IA open source lors de la conférence All Things Open fin octobre. D’ici là, l’organisation multiplie les consultations à travers le monde pour affiner sa vision. Si des ajustements sont encore possibles, Stefano Maffulli assure que les fondements sont désormais posés pour une compréhension commune de ce concept clé pour l’avenir de l’IA.
À l’heure où l’IA bouleverse nos sociétés, il est crucial de s’accorder sur ce que signifie l’ouverture dans ce domaine. Les travaux de l’OSI posent des bases solides pour démêler le vrai du faux et encourager des pratiques vertueuses. Car une IA véritablement open source est un gage de transparence, de collaboration et d’innovation responsable. Un enjeu majeur pour bâtir une IA au service de tous.