Google DeepMind ha presentado oficialmente Gemini 2.5 Computer Use, un modelo especializado construido sobre la base del potente Gemini 2.5 Pro, que permite a los desarrolladores crear agentes capaces de interactuar con interfaces gráficas como si fueran humanos. Esta capacidad implica que la IA ya no está limitada a trabajar solo con APIs o estructuras predefinidas: ahora puede navegar por webs, completar formularios, hacer clic en botones o desplazarse por una página, imitando acciones humanas en entornos digitales.
Esta evolución responde a una necesidad real: muchos procesos digitales todavía dependen de interfaces visuales que no están diseñadas para la interacción mediante API. Rellenar un formulario web, elegir una opción de un desplegable o gestionar una acción tras iniciar sesión requiere interacción visual y contextual. Gemini 2.5 Computer Use nace para cubrir precisamente ese hueco, actuando como un asistente que «ve» la pantalla y decide qué hacer, paso a paso. Continúa leyendo «Google lanza Gemini 2.5 Computer Use, su modelo para que las IA usen interfaces gráficas»