L’intelligence artificielle continue de repousser les limites de la création de contenu. Après avoir révolutionné la génération de textes et d’images, la voici qui s’attaque désormais à la vidéo avec Sora, le nouvel outil d’OpenAI. Alors que le lancement officiel est prévu ce jour pour un public restreint, le célèbre YouTubeur tech Marques Brownlee a eu la chance de tester en avant-première cette IA génératrice de vidéos. Voici ce qu’il faut en retenir.
Sora, une entité indépendante de ChatGPT
Contrairement à ce que l’on pourrait penser, Sora n’est pas intégré à ChatGPT, le désormais incontournable chatbot d’OpenAI. Il s’agit pour l’instant d’un produit à part entière, accessible via son propre site web. Sur la page d’accueil, on découvre un fil des vidéos récemment générées et mises en avant par OpenAI.
Les fonctionnalités de Sora sont assez complètes pour une première version :
- Génération de vidéos à partir de texte, mais aussi d’images uploadées
- Possibilité de sauvegarder et organiser les vidéos en dossiers
- Édition des vidéos générées grâce à la fonctionnalité « Re-mix »
Le tout avec une définition pouvant aller jusqu’à 1080p, même si cela rallonge considérablement les temps de génération, de l’ordre de plusieurs minutes par vidéo en haute qualité.
Séquençage de scènes et contrôle de contenu
Un des gros challenges des IA génératrices de vidéos est le maintien de la cohérence tout au long d’un clip. Pour y remédier, Sora propose un outil « Storyboard » qui permet d’enchaîner plusieurs prompts pour créer des scènes distinctes mais liées.
Autre point important sur un outil d’IA grand public comme celui-ci : la modération du contenu. Sora intègre de nombreuses limites, en bloquant notamment les demandes impliquant des mineurs, de la violence, des contenus explicites ou encore des éléments protégés par copyright comme les personnes célèbres, les personnages connus ou les logos de marques.
Qualité du rendu : bluffant mais perfectible
Alors, que valent les vidéos générées par Sora ? Selon Marques Brownlee, le résultat est impressionnant pour de l’IA, mais on remarque assez vite les défauts typiques de ce genre d’outils :
- Problèmes de permanence des objets qui apparaissent et disparaissent de manière incohérente
- Gestion très approximative des jambes lors des scènes de marche prolongées
- Résultat convaincant sur des contenus simples ou abstraits (animations, stop motion…), beaucoup moins sur des scènes détaillées et réalistes
C’est impressionnant pour de la vidéo générée par IA, mais on voit assez rapidement que c’est de la vidéo générée par IA. Les choses deviennent vraiment bizarres.
– Marques Brownlee à propos de Sora
Quel avenir pour les IA créatrices de vidéos ?
Malgré ses limites, le lancement de Sora par OpenAI marque une étape clé. Comme pour le texte et l’image avant elle, la vidéo générée par IA va probablement connaître une évolution très rapide dans les mois et années à venir. Si les créations de Sora sont encore loin d’égaler celles des graphistes et réalisateurs humains, il y a fort à parier que la technologie finira par s’améliorer et par trouver de nombreux cas d’usage.
En attendant, Sora se présente déjà comme un outil intéressant pour générer facilement des éléments visuels simples type animations, abstractions, effets de style… Le tout en quelques clics et sans compétence particulière en montage ou en graphisme. De quoi démocratiser un peu plus la création de contenu vidéo.