De un prompt a un mundo inmersivo: cómo Gemini y Canvas están acelerando el XR en la web

Publicado el

Ilustración surrealista de inteligencia artificial en desarrollo web con elementos flotantes y una atmósfera onírica.

La idea de crear experiencias de realidad extendida suele sonar como montar un mueble enorme sin instrucciones: necesitas herramientas, técnica, paciencia y una buena colección de tutoriales. Por eso llama la atención el enfoque que está empujando Google desde su ecosistema de desarrolladores: usar Gemini como compañero creativo-técnico para pasar de una idea escrita a un prototipo interactivo que se puede probar casi al momento.

En una entrada reciente del blog de Google for Developers, el equipo de Android XR cuenta cómo aprovechar Canvas en la app web de Gemini para generar gráficos 3D, convertirlos a XR y entrar en la escena con un simple botón tipo “Enter XR” usando WebXR. El ejemplo que muestran es deliberadamente ambicioso: una simulación de biología donde Gemini modela interacciones complejas entre células sanguíneas, las representa con WebGL y Three.js, y luego el conjunto se adapta a una experiencia inmersiva mediante APIs de WebXR. La metáfora es clara: lo que antes era un diagrama en un libro de texto pasa a ser una maqueta a escala en la que puedes “pasear” y explorar como si estuvieras dentro de una ilustración viva.

El papel de Canvas: un banco de trabajo, no solo un chat

Parte del cambio aquí no es únicamente el modelo, sino el “lugar” donde se construye. Canvas se plantea como un espacio para escribir, iterar y convertir prompts en prototipos (documentos, código y experiencias) de forma más directa que un hilo de conversación tradicional. En la práctica, funciona como una mesa de trabajo: pides una escena, revisas lo generado, ajustas detalles, pruebas y repites.

Google describe Canvas como una forma de pasar “del prompt al prototipo” apoyándose en Gemini 3 (y con ventajas adicionales para planes avanzados), lo que encaja con el objetivo de acortar el salto entre imaginar y ejecutar.

Qué necesitas para probarlo: Samsung Galaxy XR y acceso a Gemini 3 Pro

El tutorial de Google for Developers es bastante específico con los requisitos para replicar el flujo: hace falta un visor Samsung Galaxy XR y acceso a Gemini 3 Pro. La elección del hardware no es casual. Galaxy XR es uno de los primeros dispositivos comerciales alrededor de Android XR, la plataforma que Samsung, Google y Qualcomm han venido presentando como base para headsets (y, en el futuro, gafas). Samsung lo ha enmarcado como un producto cocreado con Google y Qualcomm, con la IA en el centro de la experiencia.

Desde el lado de Google, también hay una narrativa coherente: Galaxy XR como la puerta para “probar Android XR” y moverte entre inmersión total y modos más pegados al mundo real, usando voz, manos y ojos. Fuente: blog de Google sobre Galaxy XR.

El “XR Gem” y XR Blocks: darle a Gemini un rol de desarrollador

Un punto interesante del proceso es cómo se “configura” a Gemini para que piense como alguien que desarrolla XR, no solo como un asistente generalista. El artículo propone crear un “XR Gem” (una especie de perfil o agente dentro de Gemini) partiendo de un Gem preconstruido llamado XR Blocks, o bien montando uno propio con un “ultra-prompt” de XR Blocks que le da capacidades de percepción más avanzadas orientadas a física y realismo en AR.

La lógica aquí se parece a entrenar a un nuevo compañero de equipo: no basta con decir “haz XR”, necesitas fijar expectativas, un estilo y criterios. El propio texto sugiere describir un perfil del tipo “desarrollador WebXR creativo” con buen gusto visual y ejecución técnica, para que el sistema interprete la escena y genere texturas 3D más pulidas cuando use herramientas de generación de imágenes.

XR Blocks existe también como conjunto de demos y SDK orientados a explorar funciones experimentales en Android XR, con ejemplos que pueden ejecutarse en escritorio o en dispositivos como Galaxy XR.

De WebGL a WebXR: el truco está en la “puerta” de entrada

En el relato de Google, Gemini genera la escena con tecnologías web conocidas, como WebGL y Three.js, que para muchos desarrolladores son el equivalente a cocinar con ingredientes de supermercado: están disponibles, tienen comunidad y funcionan bien para gráficos 3D en navegador. Lo que cambia es el paso a WebXR, que actúa como ese marco de puerta que te permite dejar de “mirar” la escena en una pantalla y empezar a “habitarla” en un visor compatible.

La imagen mental ayuda: si WebGL es una pecera y tú estás fuera mirando, WebXR es abrir la tapa y meter la cabeza (con cuidado) dentro del ecosistema. Ese botón “Enter XR” del ejemplo es, en realidad, la interfaz mínima para una transición que antes exigía bastante configuración, pruebas con hardware y compatibilidades.

Iterar dentro del visor: cuando crear se parece a decorar una casa

El flujo propuesto apuesta por la iteración rápida. Abres Gemini en Chrome dentro de Galaxy XR, arrancas un chat con tu XR Gem y eliges Canvas. Desde ahí, puedes pedir algo como “crea un entorno volcánico” y ver cómo el mundo cambia, o “pon una mariposa ahí” para colocar objetos con precisión.

Lo interesante es que el artículo sugiere ir más allá de objetos sueltos: puedes dar “agencia” a personajes o elementos del entorno, como si estuvieras escribiendo pequeñas reglas de comportamiento. En términos cotidianos, se parece más a redecorar una habitación con instrucciones habladas que a programar una escena desde cero: “mueve el sofá”, “abre una ventana”, “pon una lámpara más cálida”.

Una capa adicional es la idea de incrustar Gemini Live dentro de la experiencia, para hablar con Gemini sin salir del entorno inmersivo.

Qué cambia para desarrolladores: prototipado más rápido y menos fricción

Google enmarca esto como una forma de acelerar el prototipado 3D y explorar conceptos interactivos en tiempo real, reduciendo la necesidad de dominar de entrada todas las capas de un pipeline XR tradicional. Dicho sin magia: no elimina la complejidad real de un producto XR terminado, pero sí puede recortar el tiempo de “primera versión jugable”, esa maqueta que sirve para validar si la idea funciona antes de invertir semanas.

Desde el punto de vista del ecosistema, encaja con el posicionamiento de Android XR como plataforma “en la era Gemini”, donde la IA no es un añadido, sino parte del uso y también del desarrollo. Fuente: documentación oficial de Android Developers sobre Gemini en Android XR.

Compartir como enlace: la web como canal de distribución del XR

Otro detalle práctico es el formato de salida: según el flujo descrito, cuando terminas una creación en Canvas, se convierte en un enlace web compartible. Esto es relevante porque baja una barrera habitual del XR: la distribución. En vez de compilar una app nativa o pasar por tiendas, el resultado vive en la web y cualquiera puede abrirlo (con el dispositivo compatible) como si fuera una página más.

Visto con una metáfora simple, es la diferencia entre invitar a alguien a tu casa y darle instrucciones complicadas para llegar, o mandarle una ubicación y decir “pulsa aquí”. Para comunidades de creadores, educación o demos internas, esa facilidad puede marcar la diferencia entre “qué bonito” y “lo probé de verdad”.

El contexto del hardware: por qué importa Galaxy XR

Todo este enfoque se apoya en que el hardware ya está llegando al mercado. Medios como Wired han descrito el Samsung Galaxy XR como un competidor más asequible frente a Apple Vision Pro, con énfasis en la integración de Gemini y capacidades de seguimiento (manos, ojos) para interacción natural, lo que favorece ese “crear tocando y hablando” que propone Canvas.

También hay cobertura que pone cifras y disponibilidad sobre la mesa, lo que ayuda a entender que no hablamos de un prototipo de laboratorio.

Lo que conviene vigilar: expectativas, calidad final y control creativo

El riesgo típico de estas demostraciones es confundir prototipo con producto. Que Gemini te ayude a levantar una escena interactiva no garantiza rendimiento óptimo, accesibilidad, seguridad, consistencia visual o un diseño de interacción bien resuelto. Es como usar una mezcla preparada para hacer bizcocho: te permite hornear más rápido, pero si quieres una pastelería, vas a tener que afinar receta, ingredientes y técnica.

Aun así, el valor práctico es evidente: para aprender, enseñar, presentar una idea o explorar mecánicas, el flujo Gemini + Canvas + WebXR ofrece una ruta con menos fricción, apoyada en estándares web y un dispositivo pensado para la era Android XR.