Gemini Live : Le Nouveau Rival Vocal d’OpenAI par Google

Lors de son récent événement, Google a dévoilé Gemini Live, une fonctionnalité innovante basée sur l’IA qui permet aux utilisateurs d’avoir des échanges vocaux fluides et naturels avec une intelligence artificielle. Alimenté par le dernier modèle de langage de Google, Gemini Live se positionne comme un rival direct du mode vocal avancé de ChatGPT par OpenAI, qui reste en phase de test alpha limité.

Des conversations dynamiques et mains libres avec l’IA

Gemini Live révolutionne les interactions mobiles avec l’IA grâce à des fonctionnalités uniques. Les utilisateurs peuvent interrompre l’IA pendant qu’elle répond pour approfondir certains points, mettre en pause et reprendre les discussions à leur guise. De plus, le mode mains libres permet de poursuivre les échanges même lorsque le téléphone est verrouillé ou en arrière-plan, imitant ainsi le déroulement naturel d’un appel.

Intégrations poussées avec l’écosystème Android

Google enrichit l’expérience utilisateur en intégrant Gemini Live de manière transparente à son écosystème Android. Grâce à de nouvelles extensions comme Keep, Tasks et Utilities, les utilisateurs pourront effectuer diverses tâches sans changer d’application :

  • Récupérer des recettes à partir d’e-mails
  • Compiler des listes de courses
  • Créer des playlists musicales nostalgiques

L’extension Calendrier sera particulièrement utile pour gérer son emploi du temps. Il suffira de photographier le flyer d’un concert pour que Gemini Live vérifie la disponibilité et programme des rappels pour l’achat de billets.

Rapidité et précision améliorées avec Gemini 1.5 Flash

Pour offrir des réponses plus rapides et fiables, Google introduit de nouveaux modèles comme Gemini 1.5 Flash. La firme prévoit de continuer à perfectionner ces aspects tout en étendant les intégrations à d’autres services comme Home et Messages.

Gemini Live ne permettra pas de chanter ou d’imiter des voix au-delà des dix options prédéfinies, probablement pour éviter les problèmes de droits d’auteur.

– Leland Rechis, chef de produit chez Google

Contrairement à OpenAI qui mettait en avant la reconnaissance vocale émotionnelle, Google a choisi de ne pas prioriser cette capacité pour Gemini Live, peut-être en raison de controverses passées. Quoi qu’il en soit, avec Gemini Live, Google franchit une étape majeure en étant le premier à proposer des conversations vocales entièrement développées avec une IA, ouvrant ainsi la voie à une nouvelle ère d’interactions homme-machine.

author avatar
MondeTech.fr

À lire également