Stability AI Dévoile Stable Diffusion 3.5 Pour Une Génération d’Images Plus Diversifiée

La startup Stability AI vient de lancer la nouvelle génération de ses modèles d’IA générative d’images, baptisée Stable Diffusion 3.5. Après une série de controverses liées à des problèmes techniques et des changements de licence, l’entreprise promet cette fois-ci une création visuelle plus diversifiée, personnalisable et performante que jamais.

Une Trilogie de Modèles Complémentaires

La série Stable Diffusion 3.5 se compose de trois modèles aux caractéristiques distinctes :

  • Stable Diffusion 3.5 Large : Avec ses 8 milliards de paramètres, c’est le modèle le plus puissant de la gamme, capable de générer des images jusqu’à 1 mégapixel de résolution.
  • Stable Diffusion 3.5 Large Turbo : Une version allégée de 3.5 Large qui génère les images plus rapidement, au prix d’une légère perte de qualité.
  • Stable Diffusion 3.5 Medium : Optimisé pour fonctionner sur les appareils mobiles et ordinateurs portables, ce modèle produit des images de 0,25 à 2 mégapixels.

Si les versions Large sont déjà disponibles, il faudra patienter jusqu’au 29 octobre pour mettre la main sur 3.5 Medium.

Diversité Sans Effort et Styles Variés

La grande nouveauté mise en avant par Stability AI est la capacité des modèles 3.5 à générer des images plus « diverses », représentant des personnes aux différents types de peau et caractéristiques, sans avoir besoin de le spécifier dans les prompts. Hanno Basse, CTO de l’entreprise, explique :

Pendant l’entraînement, chaque image est sous-titrée avec des versions multiples de prompts, en priorisant les plus courts. Cela assure une distribution plus large et diverse des concepts pour chaque description textuelle.

Hanno Basse, CTO de Stability AI

L’entreprise affirme également que les nouveaux modèles excellent dans la génération d’images dans une grande variété de styles, y compris l’art 3D. Elle prévient cependant que des artefacts et erreurs peuvent toujours survenir, en raison de compromis techniques nécessaires.

Licences Inchangées et Controverses en Vue

Côté licences, Stability AI maintient sa politique habituelle : les modèles sont gratuits pour un usage non-commercial et pour les entreprises générant moins d’un million de dollars de revenus annuels. Au-delà, une licence entreprise payante est requise.

La startup a fait polémique cet été avec des conditions restrictives concernant les images utilisées pour l’entraînement de ses IA. Malgré un assouplissement en réaction aux critiques, Stability AI reste potentiellement exposée à des poursuites pour violation de droits d’auteur, un épineux problème qui touche tout le secteur de l’IA générative.

Un Pas de Plus Vers la Démocratisation de la Création IA

Avec Stable Diffusion 3.5, Stability AI renforce sa position de pionnier de l’IA générative accessible au plus grand nombre. Malgré des défis techniques et juridiques persistants, la startup continue d’innover pour mettre des outils de création visuelle toujours plus puissants entre les mains des particuliers et professionnels.

Reste à voir comment ces nouveaux modèles se comporteront en pratique et s’ils sauront convaincre une communauté d’utilisateurs exigeants et créatifs. Une chose est sûre : la démocratisation de l’IA générative ne fait que commencer et Stability AI compte bien être aux avant-postes de cette révolution.

À lire également