Gemini ya genera modelos 3D y simulaciones interactivas en mitad del chat: la respuesta deja de ser texto y pasa a ser un objeto que puedes manipular

Google ha activado una capacidad nueva en la app de Gemini: ahora puede generar simulaciones y modelos 3D interactivos directamente dentro de la conversación, con sliders y campos numéricos para manipular variables en tiempo real. La función se está desplegando globalmente para todos los usuarios de la app de Gemini, según anunció Google en su blog oficial. Para activarla, hay que entrar en gemini.google.com, seleccionar el modelo Pro en la barra de prompts y pedirle que «muestre» o «ayude a visualizar» un concepto complejo.

El cambio conceptual es importante. Hasta ahora, cuando le pedías a un chatbot que te explicara cómo orbita la Luna alrededor de la Tierra, recibías un párrafo de texto y, con suerte, un diagrama estático. Ahora la respuesta es una simulación funcional con sliders para ajustar la velocidad inicial y la fuerza de gravedad, e introducir números exactos para ver cómo esas variables específicas crean (o destruyen) una órbita estable. Lo mismo sirve para rotar una molécula, simular un sistema físico complejo, o ver cómo cambia un fenómeno biológico al modificar sus parámetros. Como escriben desde Google: «Gemini puede transformar tus preguntas y temas complejos en visualizaciones personalizadas e interactivas, directamente dentro de tu chat».

La capacidad se apoya en Gemini 3, presentado en noviembre y en sus iteraciones posteriores (Gemini 3.1 Pro llegó en febrero con mejoras significativas en razonamiento y generación nativa de SVG y código 3D desde lenguaje natural). Es la combinación de varias piezas: razonamiento multimodal profundo, generación de código frontend a primera intención, y la capacidad de envolver el resultado en una interfaz interactiva sin pasos intermedios. No es solo un renderizador; es razonamiento aplicado a hacer que el output del chat sea manipulable.

Lo interesante es la dirección estratégica. ChatGPT y Claude siguen apostando casi todo a la conversación textual y al razonamiento. Google se está diferenciando por la interactividad visual nativa dentro del chat. Es la apuesta lógica para una empresa que controla Search, YouTube y Workspace: el contexto de uso de Google es educativo, divulgativo y exploratorio mucho más que conversacional puro. Una simulación interactiva en mitad de una respuesta vale el doble en una clase de física que en un debate sobre filosofía. Ya en Gemini 2.5 Pro vimos cómo el modelo generaba prototipos interactivos completos en un solo prompt, incluyendo simuladores de juegos básicos y aplicaciones funcionales. Esa capacidad ahora se traslada de «código que el usuario tiene que ejecutar» a «objeto interactivo que aparece en mitad de la respuesta».

Mi valoración: este es uno de esos cambios pequeños en apariencia pero que reorientan el producto entero. La mayoría de personas no quieren leer texto sobre una órbita; quieren verla. La mayoría de estudiantes no quieren párrafos sobre una reacción química; quieren manipular la temperatura y ver qué pasa. El sector educativo es el ganador más obvio (y es exactamente donde Google ya ha apostado fuerte con Gemini for Education gratuito para centros). El problema potencial: un texto se puede verificar leyéndolo. Una simulación interactiva impone una sensación de autoridad visual que puede ser difícil de cuestionar incluso si la física del modelo es ligeramente errónea. La interactividad genera confianza, y la confianza no siempre coincide con precisión. Veremos cómo Google maneja eso.

Preguntas frecuentes

¿Cómo activo las simulaciones 3D en Gemini? Entra en gemini.google.com, selecciona el modelo Pro en la barra de prompts y pídele que «muestre» o «ayude a visualizar» un concepto complejo. Está disponible globalmente para todos los usuarios de la app de Gemini. ¿Qué tipos de visualizaciones genera? Modelos 3D rotables, simulaciones físicas con sliders ajustables, moléculas manipulables, gráficos interactivos y otras visualizaciones que dependen del concepto consultado. ¿En qué se diferencia de los diagramas anteriores? Antes Gemini devolvía texto con diagramas estáticos. Ahora son simulaciones funcionales con controles para modificar variables y ver el resultado en tiempo real.