Microsoft Dévoile Copilot Vision, Une IA Qui Lit Nos Écrans

Dans un monde où l’intelligence artificielle ne cesse de repousser les limites, Microsoft franchit une nouvelle étape avec Copilot Vision. Cet outil IA révolutionnaire, actuellement disponible en prévisualisation limitée aux États-Unis, promet de transformer notre façon d’interagir avec le web. Embarqué dans le navigateur Edge de Microsoft, Copilot Vision a la capacité de lire nos écrans et de répondre à nos questions sur les sites que nous visitons.

Une IA qui comprend le contenu de nos écrans

Copilot Vision va bien au-delà d’un simple assistant de navigation. Grâce à sa capacité à analyser le texte et les images des pages web, il peut répondre à des requêtes spécifiques comme « Quelle est la recette de ce lasagne ? » lorsque vous consultez un blog culinaire. C’est une véritable révolution dans la manière dont nous interagissons avec le contenu en ligne.

Quand vous activez Copilot Vision, il voit la page sur laquelle vous êtes, il lit avec vous et vous pouvez parler ensemble du problème auquel vous faites face.

– Microsoft dans un billet de blog

Un assistant polyvalent intégré à Edge

Mais les capacités de Copilot Vision ne s’arrêtent pas là. Il peut également résumer et traduire du texte, repérer les produits en promotion dans un catalogue en ligne, et même servir d’assistant de jeu, en proposant par exemple des conseils pendant des parties d’échecs sur Chess.com. C’est un véritable couteau suisse numérique, discrètement intégré en bas de votre navigateur Edge, prêt à vous aider dès que vous en avez besoin.

La confidentialité des données au cœur des préoccupations

Conscient des enjeux de confidentialité, Microsoft tient à rassurer les utilisateurs. Les données traitées par Copilot Vision, qu’il s’agisse d’audio, d’images ou de texte, sont supprimées après chaque session et ne sont pas utilisées pour entraîner les modèles d’IA, du moins dans cette version de prévisualisation. De plus, Copilot Vision est pour l’instant limité à une liste prédéfinie de sites populaires et ne peut pas accéder aux contenus payants ou « sensibles ».

Défis avec les éditeurs de presse

Cependant, cette approche prudente est en partie le fruit de litiges juridiques avec des organes de presse. Le New York Times a notamment accusé Microsoft de permettre aux utilisateurs de contourner son paywall en servant des articles via le chatbot Copilot sur Bing. De nombreux grands éditeurs ont choisi de bloquer les outils d’IA, craignant une utilisation non autorisée de leurs données et une explosion des coûts serveur.

Microsoft affirme que Copilot Vision respectera les règles « lisibles par machine » des sites concernant l’IA, comme celles qui interdisent aux robots d’extraire des données pour l’entraînement de l’IA. Mais les contrôles précis que Vision respectera restent à définir. Si la tendance actuelle se poursuit, Copilot Vision pourrait ne pas fonctionner sur certains des principaux sites d’information du web.

Collaborer avec les éditeurs pour une IA utile

Malgré ces défis, Microsoft se dit déterminé à prendre en compte les commentaires pour apaiser les inquiétudes des éditeurs. La société a collaboré avec des éditeurs tiers pour comprendre comment Vision pourrait être utilisé afin d’aider les gens à mieux s’engager et prendre des décisions sur leurs pages. Ces contributions aideront Microsoft à concevoir Vision pour qu’il soit plus utile dans son interaction avec les pages web.

En fin de compte, Copilot Vision représente une avancée majeure dans l’intégration de l’IA à notre expérience de navigation web. Bien qu’il y ait encore des questions à régler, notamment en ce qui concerne les relations avec les éditeurs, le potentiel de cet outil pour révolutionner notre façon d’interagir avec le contenu en ligne est indéniable. À mesure que Microsoft peaufinera Copilot Vision en tenant compte des commentaires, nous pouvons nous attendre à ce que cet assistant IA devienne un compagnon incontournable de nos sessions de navigation.

  • Copilot Vision : un outil IA révolutionnaire intégré à Microsoft Edge
  • Capacité à lire et comprendre le contenu des pages web
  • Fonctionnalités polyvalentes : résumé, traduction, détection de promotions, assistance de jeu
  • Enjeux de confidentialité des données et de relations avec les éditeurs à résoudre
  • Un potentiel énorme pour transformer notre navigation web

À lire également