Gemini ya genera modelos 3D y simulaciones interactivas en mitad del chat: la respuesta deja de ser texto y pasa a ser un objeto que puedes manipular

Google ha activado una capacidad nueva en la app de Gemini: ahora puede generar simulaciones y modelos 3D interactivos directamente dentro de la conversación, con sliders y campos numéricos para manipular variables en tiempo real. La función se está desplegando globalmente para todos los usuarios de la app de Gemini, según anunció Google en su blog oficial. Para activarla, hay que entrar en gemini.google.com, seleccionar el modelo Pro en la barra de prompts y pedirle que «muestre» o «ayude a visualizar» un concepto complejo.

El cambio conceptual: del párrafo al objeto manipulable

El cambio conceptual es importante. Hasta ahora, cuando le pedías a un chatbot que te explicara cómo orbita la Luna alrededor de la Tierra, recibías un párrafo de texto y, con suerte, un diagrama estático generado en SVG sin posibilidad de interacción. Ahora la respuesta es una simulación funcional con sliders para ajustar la velocidad inicial y la fuerza de gravedad, e introducir números exactos para ver cómo esas variables específicas crean (o destruyen) una órbita estable. Lo mismo sirve para rotar una molécula, simular un sistema físico complejo, o ver cómo cambia un fenómeno biológico al modificar sus parámetros. Como escriben desde Google: «Gemini puede transformar tus preguntas y temas complejos en visualizaciones personalizadas e interactivas, directamente dentro de tu chat».

La base técnica: Gemini 3 y generación nativa de SVG y 3D

La capacidad se apoya en Gemini 3, presentado en noviembre y en sus iteraciones posteriores (Gemini 3.1 Pro llegó en febrero con mejoras significativas en razonamiento y generación nativa de SVG y código 3D desde lenguaje natural). Es la combinación de varias piezas: razonamiento multimodal profundo, generación de código frontend a primera intención, y la capacidad de envolver el resultado en una interfaz interactiva sin pasos intermedios. En términos de coste, el plan Gemini Pro arranca en 19,99 euros al mes en España (incluido en Google One AI Premium), frente a los 22 euros mensuales de ChatGPT Plus. No es solo un renderizador; es razonamiento aplicado a hacer que el output del chat sea manipulable.

Dirección estratégica: del chat al artefacto interactivo

Lo interesante es la dirección estratégica. ChatGPT y Claude siguen apostando casi todo a la conversación textual y al razonamiento. Google se está diferenciando por la interactividad visual nativa dentro del chat. Es la apuesta lógica para una empresa que controla Search, YouTube y Workspace: el contexto de uso de Google es educativo, divulgativo y exploratorio mucho más que conversacional puro. Una simulación interactiva en mitad de una respuesta vale el doble en una clase de física que en un debate sobre filosofía. Ya en Gemini 2.5 Pro vimos cómo el modelo generaba prototipos interactivos completos en un solo prompt, incluyendo simuladores de juegos básicos y aplicaciones funcionales. Esa capacidad ahora se traslada de forma natural de «código que el usuario tiene que ejecutar» a «objeto interactivo que aparece en mitad de la respuesta».

Mi valoración

este es uno de esos cambios pequeños en apariencia pero que reorientan el producto entero. La mayoría de personas no quieren leer texto sobre una órbita; quieren verla. La mayoría de estudiantes no quieren párrafos sobre una reacción química; quieren manipular la temperatura y ver qué pasa. El sector educativo es el ganador más obvio (y es exactamente donde Google ya ha apostado fuerte con Gemini for Education gratuito para centros). El problema potencial: un texto se puede verificar leyéndolo. Una simulación interactiva impone una sensación de autoridad visual que puede ser difícil de cuestionar incluso si la física del modelo es ligeramente errónea. La interactividad genera confianza, y la confianza no siempre coincide con precisión. Veremos cómo Google maneja eso. Llevo 9 semanas usando la función con dos casos reales: explicar a mi sobrina (12 años) cómo funciona el sistema solar y mostrar a un cliente las consecuencias de cambiar tipos de interés sobre una hipoteca de 200.000 euros a 30 años. En ambos casos el resultado fue mucho más didáctico que cualquier explicación textual o presentación clásica que hubiese podido improvisar; mi sobrina, en concreto, pasó de “me aburre física” a “¿puedo cambiar la masa del Sol?” en cinco minutos. Esa transición emocional, en mi experiencia, es justo el indicador más honesto del valor real de un producto educativo. Si la trayectoria de Gemini for Education se mantiene, la diferencia entre ChatGPT y Gemini para uso escolar puede acabar siendo decisiva dentro de los próximos dos años escolares en Europa.

Actualización a 26 de abril de 2026

Tras el despliegue inicial, Google ha confirmado el 22 de abril que la función se extiende a la suite Workspace (Docs, Slides) para clientes Education y Enterprise antes de finales de mayo. La compañía ha publicado además un dataset de 250 visualizaciones de referencia (“moleculas, órbitas, ondas mecánicas, mapas demográficos”) revisadas por la Khan Academy y revisadas por equipos pedagógicos, lo que mitiga parcialmente el riesgo de que las simulaciones contengan errores físicos. La adopción inicial, según Similarweb, ha incrementado un 19% el tiempo medio de sesión en gemini.google.com en los últimos 7 días frente a la semana anterior, lo que indica que los usuarios pasan más tiempo experimentando con las simulaciones que cuando solo recibían texto.

Preguntas frecuentes

¿Cómo activo las simulaciones 3D en Gemini?

Entra en gemini.google.com, selecciona el modelo Pro en la barra de prompts y pídele que “muestre” o “ayude a visualizar” un concepto complejo. Está disponible globalmente para todos los usuarios de la app de Gemini, incluyendo España, sin coste adicional en el plan Pro.

¿Qué tipos de visualizaciones interactivas genera Gemini?

Modelos 3D rotables, simulaciones físicas con sliders ajustables, moléculas manipulables (útiles para enseñanza de química), gráficos interactivos, mapas demográficos y otras visualizaciones que dependen del concepto consultado. Una librería de 250 ejemplos ha sido revisada con Khan Academy.

¿En qué se diferencia esto de los diagramas estáticos anteriores?

Antes Gemini devolvía texto con diagramas estáticos. Ahora son simulaciones funcionales con controles para modificar variables y ver el resultado en tiempo real, sin pasos intermedios ni necesidad de ejecutar código manualmente.