Google dévoile Gemini 2.5 Computer Use, une IA capable de naviguer sur le web de manière autonome
Google lance Gemini 2.5 Computer Use, une IA capable de naviguer sur le web sans intervention humaine
Un jour après l’événement DevDay organisé par son concurrent OpenAI, Google présente Gemini 2.5 Computer Use, un nouveau modèle d’intelligence artificielle destiné à agir en autonomie sur les interfaces des pages web, comme le ferait un utilisateur.
Le système peut cliquer sur des éléments, saisir du texte dans des formulaires et faire défiler une page. Il s’appuie sur les capacités de compréhension visuelle et de raisonnement associées au Gemini 2.5 Pro.
Mode opératoire et architecture
Le fonctionnement repose sur une boucle d’actions : après réception d’une instruction, l’agent analyse à chaque étape une capture d’écran de l’interface, le contexte de navigation et l’historique des actions pour déterminer la prochaine étape, jusqu’à ce que la tâche soit accomplie.
Sécurité et conditions d’utilisation
Pour les requêtes sensibles, comme un achat en ligne, le système demande une confirmation explicite à l’utilisateur avant de poursuivre.
État de disponibilité
Pour le moment, Gemini 2.5 Computer Use est proposé en préversion et réservé aux développeurs, avec un accès limité au navigateur web.