Alors que le géant américain OpenAI impressionnait récemment avec son modèle Sora capable de générer des vidéos réalistes d’une minute, un nouveau challenger chinois fait son apparition sur le marché de l’IA générative vidéo. Baptisé Kling, ce modèle développé par Kwai semble en mesure de repousser encore plus loin les limites en proposant des vidéos allant jusqu’à deux minutes. Plongeons ensemble dans les capacités étonnantes de cette IA venue de Chine.
Kling double la mise sur la durée et la résolution
Là où Sora se limitait à des vidéos d’une minute maximum, Kling permet de générer des séquences deux fois plus longues, et ce jusqu’en résolution 1080p à 30 images par seconde. Des caractéristiques techniques supérieures qui ouvrent le champ des possibles en termes de créativité et de réalisme.
Dans les coulisses des prouesses de Kling
Pour parvenir à de tels résultats, Kling s’appuie sur plusieurs technologies de pointe :
- Un système d’attention spatio-temporelle 3D pour modéliser les mouvements et interactions physiques de manière fluide et naturelle
- Une architecture de transformateur de diffusion afin de combiner concepts et idées pour des scènes créatives (imaginez un panda guitariste !)
- Un Variational Autoencoder (3D VAE) améliorant expressions faciales et gestuelle à partir d’une simple image pour un réalisme époustouflant
De quoi donner vie à des vidéos mettant en scène aussi bien des animaux que des humains dans des situations du quotidien ou complètement fantaisistes avec un niveau de détail et de crédibilité jamais vu.
Kwaiyin, l’app pour tester la magie de Kling
Si Kling n’est pour l’instant accessible qu’en démo publique restreinte en Chine, il est déjà possible de s’inscrire sur liste d’attente en téléchargeant l’application Kwaiyin. La procédure requiert cependant un numéro de téléphone chinois pour recevoir un SMS de validation.
Kling s’impose comme un sérieux rival pour Sora
Avec ses capacités de génération vidéo supérieures aussi bien en durée qu’en qualité, Kling pourrait rapidement s’imposer comme l’une des références en matière d’IA générative, au même titre que son concurrent Sora. Un duel au sommet entre deux géants technologiques américain et chinois qui ne fait sans doute que commencer et promet de belles avancées dans les mois à venir.
Reste à voir quand Kling sera disponible à plus grande échelle et comment les créateurs du monde entier se saisiront de cet outil révolutionnaire pour repousser les limites de la créativité. Une chose est sûre, la démocratisation des IA génératives de vidéo comme Kling et Sora marque un tournant majeur qui va transformer durablement la façon de concevoir du contenu.