Google ha quitado el último gran obstáculo entre Gemini y la productividad real. Desde el 29 de abril, la app de Gemini genera archivos descargables directamente desde la conversación: Docs, Sheets, Slides, PDF, DOCX, XLSX, CSV, LaTeX, TXT, RTF y MD. Sin pasar por Workspace, sin licencia premium, sin copiar y pegar. La función está disponible globalmente para todos los usuarios de la app de Gemini, también en plan gratuito. La pregunta ya no es «¿puede Gemini hacer esto?» sino «¿qué le pido exactamente para que el archivo me llegue listo?».
La diferencia entre un prompt vago y uno específico es la diferencia entre obtener un primer borrador genérico y un entregable listo para enviar. He preparado cinco prompts concretos que cubren los casos de uso más útiles del día a día: presupuesto, borrador, PDF colaborativo, guía de estudio y presentación. Cada uno con la estructura exacta que conviene pedir, qué tipo de archivo devuelve Gemini y dónde tiene sentido usarlo. Al final, la comparativa con ChatGPT y Claude, los dos asistentes que también generan archivos descargables y donde Google llega como tercero.
Prompt 1: De caos de gastos a hoja de cálculo presupuestaria
El caso más universal y el más fácil de resolver. Tienes datos de gastos sueltos (en correos, notas, una conversación con tu pareja) y necesitas convertirlos en un presupuesto manejable. Antes había que abrir Excel, montar columnas, escribir fórmulas. Ahora basta con describir el contexto:
«Crea una hoja de cálculo en formato XLSX para organizar mi mudanza a [ciudad]. Incluye una pestaña con presupuesto desglosado por habitación con columnas Concepto, Presupuesto estimado, Gasto real, Diferencia y % del total; una pestaña con lista de contactos de proveedores (electricidad, gas, internet, mudanza) con columnas Empresa, Teléfono, Email, Notas; y una pestaña para comparar presupuestos de empresas de mudanza con columnas Empresa, Volumen estimado, Precio base, Extras, Precio total, Valoración.»
Lo que devuelve Gemini es un archivo .xlsx con tres pestañas, columnas con cabeceras formateadas, fórmulas básicas (suma de presupuesto, diferencia entre estimado y real) y celdas listas para rellenar. No es Excel avanzado, pero es la diferencia entre empezar con una hoja en blanco y empezar con la estructura ya montada. La clave del prompt es nombrar las columnas exactas que quieres y separar las pestañas por función.
Prompt 2: De ideas dispersas a borrador estructurado en Word
El segundo prompt resuelve el problema de la página en blanco para cualquier escrito mínimamente formal: una propuesta para un cliente, una carta de motivación, una newsletter interna. La técnica está en darle a Gemini contexto suficiente para que el borrador no salga genérico:
«Genera un documento DOCX con una propuesta comercial dirigida a [tipo de cliente]. Mi negocio es [descripción breve]. Mi diferencial es [valor concreto]. Estructura: portada con título y resumen ejecutivo, sección de contexto del cliente, sección de propuesta de valor con tres puntos, sección de cronograma con fases, sección de inversión con tres opciones (básica, recomendada, premium), y cierre con próximos pasos. Tono profesional pero cercano, párrafos cortos, evita clichés corporativos como ‘soluciones de vanguardia’ o ‘sinergia’.»
Gemini devuelve un .docx completo con la estructura pedida, párrafos redactados, jerarquía de encabezados aplicada y formato listo para abrir en Word, Google Docs o Pages. La instrucción de evitar clichés corporativos es importante: sin esa restricción, Gemini tiende a producir frases típicas de nota de prensa que destruyen la credibilidad de cualquier propuesta. La inversión de cinco segundos en escribir «evita estos clichés» mejora el output más que cualquier rerun.
Prompt 3: De conversación larga a PDF compartible
El tercer prompt es el que cierra el círculo entre IA y «documento final». Has tenido una sesión larga con Gemini explorando una idea, pidiendo análisis, refinando enfoques. Ahora necesitas un PDF que puedas mandar a un colaborador o a un cliente sin que tenga que abrir tu chat:
«Consolida toda nuestra conversación de hoy en un PDF de máximo 4 páginas. Estructura: título descriptivo, resumen ejecutivo de 5 líneas, tres secciones principales con subapartados, una tabla con los datos clave que mencioné, y un anexo con próximos pasos numerados. Diseño limpio, tipografía legible, sin elementos decorativos innecesarios. Incluye fecha de hoy en la cabecera.»
El .pdf generado captura el hilo de la conversación pero formateado como documento profesional, no como transcripción. Gemini sintetiza, prioriza, omite el ruido y produce algo que puede pasar como entregable de consultoría sin pasar por Word intermedio. Es la diferencia entre «te paso lo que dijo la IA» y «te paso un análisis ejecutivo». Funcionalmente, es el caso de uso que más justifica la actualización.
Prompt 4: De apuntes desordenados a guía de estudio en LaTeX
Este es el caso de uso que el equipo de Google destacó explícitamente en su anuncio. Si subes apuntes manuscritos (fotos de cuaderno, transcripciones, capturas de pizarra) y pides una guía de estudio en formato LaTeX, Gemini procesa el material y devuelve un PDF con calidad académica:
«Adjunto mis apuntes de [asignatura/materia] de las últimas tres clases. Genera una guía de estudio completa en formato PDF usando LaTeX. Estructura: índice automático, capítulos por tema, sección de conceptos clave en negrita al inicio de cada capítulo, ejemplos numerados, fórmulas matemáticas formateadas correctamente con notación LaTeX, gráficos descriptivos donde tenga sentido (representación de funciones, esquemas de procesos), y al final una sección de preguntas tipo examen con sus soluciones desarrolladas. Densidad alta de información, sin relleno.»
El resultado es un .pdf con tipografía académica, ecuaciones matemáticas correctamente renderizadas (raíces cuadradas, integrales, sumatorios), índice navegable y secciones jerarquizadas. Para estudiantes universitarios de carreras técnicas, este caso de uso solo justifica la apertura de la cuenta. La diferencia entre apuntes propios mal organizados y una guía LaTeX bien estructurada es la diferencia entre estudiar tres horas o estudiar una.
Prompt 5: De idea a presentación de 8-10 diapositivas
El último prompt es el que históricamente más resistencia ha encontrado: generar una presentación visualmente coherente desde texto plano. Gemini ahora resuelve el caso para escenarios sencillos:
«Crea una presentación de 8-10 diapositivas en formato PPTX (PowerPoint) sobre [tema]. Audiencia: [perfil concreto]. Objetivo: [qué quieres que entiendan o decidan tras verla]. Estructura: 1) Portada con título y subtítulo, 2) Contexto/problema con dato impactante, 3-5) Tres argumentos principales con un dato verificable cada uno, 6) Caso práctico o ejemplo concreto, 7) Comparativa con alternativas (tabla simple), 8) Recomendación final con tres pasos, 9) Preguntas frecuentes anticipadas, 10) Cierre con call to action. Diseño minimalista, tipografía sans-serif, máximo 30 palabras por diapositiva, sin elementos decorativos sobrecargados.»
El .pptx que devuelve Gemini es directamente editable en PowerPoint o en Google Slides. La estructura sigue la lógica del prompt, los textos son concisos por la restricción de «máximo 30 palabras», y el diseño es lo bastante neutro como para sobrevivir a cualquier marca corporativa. No es un deck de inversión que vaya a impresionar a un VC, pero es perfectamente válido para una presentación interna, una clase o una reunión de cliente.
La comparativa: ¿Gemini, ChatGPT o Claude?
La pregunta inevitable cuando aparece una nueva función IA es si la competencia ya hace lo mismo. La respuesta para generación de archivos descargables es matizada:
ChatGPT lleva meses generando archivos a través de varias rutas. Code Interpreter (ahora integrado como Advanced Data Analysis) procesa datos y devuelve archivos XLSX, CSV o PDF. Canvas permite crear y editar documentos directamente. La capacidad existe pero está repartida entre funciones distintas; no hay un solo «genera el archivo» universal. Para Excel y análisis de datos, ChatGPT sigue siendo más sólido por la integración con Python en Code Interpreter.
Claude rompió la barrera de generación de archivos descargables en septiembre de 2025 para Max, Team y Enterprise, y Anthropic abrió la función al plan gratuito en febrero de 2026. Los formatos soportados incluyen Excel (.xlsx), PowerPoint (.pptx), Word (.docx) y PDF, con descarga directa o guardado en Google Drive y un límite de 30 MB por archivo. El acercamiento de Claude es práctico: el chat se convierte en un «taller de oficina» donde la conversación produce el entregable. La calidad de los archivos generados por Claude es notable, especialmente para documentos largos, y la integración con su sistema de Skills (paquetes de instrucciones reutilizables) permite mantener consistencia entre archivos del mismo tipo.
Gemini llega como tercero pero con tres ventajas específicas. Primera: disponibilidad global gratuita inmediata, sin distinción de plan, lo que lo coloca en una posición masiva difícil de igualar a corto plazo. Segunda: soporte nativo de LaTeX, que ChatGPT y Claude pueden hacer pero no tan integrado en el flujo. Tercera: integración profunda con Workspace, que permite generar el archivo en Gemini y abrirlo directamente en Docs, Sheets o Slides como archivo nativo, no como import.
¿Qué eliges según tu caso de uso?
Si trabajas habitualmente con datos numéricos y necesitas análisis estadístico antes de generar el archivo, ChatGPT con Code Interpreter sigue siendo más potente. Si tu prioridad es producir documentos largos con razonamiento profundo (informes técnicos, contratos, propuestas detalladas), Claude tiene ventaja por su capacidad de mantener coherencia en miles de palabras y por la integración con Skills para flujos repetibles. Si vives en el ecosistema Google y necesitas que los archivos generados se integren limpiamente con Drive, Docs o Slides, Gemini es la opción natural y ahora gratuita.
La realidad para la mayoría de usuarios es que estas tres opciones no se excluyen. ChatGPT para análisis de datos, Claude para documentos largos, Gemini para archivos de Workspace y casos académicos con LaTeX. La elección por suscripción exclusiva es propia de usuarios profesionales con presupuesto limitado. Para el resto, tener cuentas en los tres y elegir según el caso es la estrategia óptima. La buena noticia es que el plan gratuito de los tres ya cubre la mayoría de casos de uso.
Mi valoración
Lo que más me convence del lanzamiento de Gemini con archivos es la decisión de Google de hacerla gratuita y global desde el día uno. Es la jugada que tiene sentido para un asistente que llega tarde a esta capacidad y que necesita capturar usuarios masivos antes de que ChatGPT y Claude consoliden la función como propietaria. La estrategia es la misma que usó Google con Gmail en 2004 frente a Hotmail (gigabyte gratis cuando todos daban megas) y con Maps frente a MapQuest: capacidad superior gratis para reventar la economía del competidor. Funciona porque Google puede absorber el coste de inferencia gracias a su infraestructura propia (TPUs, modelos optimizados, integración con Workspace), mientras OpenAI y Anthropic dependen de Nvidia y Microsoft para su compute. Lo que más me preocupa es la calidad inicial de los archivos generados frente a la expectativa que Google está creando. Las pruebas tempranas que circulan en redes muestran que Gemini hace bien los archivos sencillos (hojas de cálculo con tres pestañas, presentaciones de 8-10 slides, PDFs de 4 páginas) pero todavía tiene problemas con documentos complejos: tablas dinámicas en Excel, animaciones en PowerPoint, diseños tipográficos avanzados en PDF. La diferencia entre «Gemini genera archivos» y «Gemini genera archivos profesionales» es exactamente la diferencia entre 2026 y 2027 en este sector. Anthropic ya pasó por la misma curva con Claude y le costó seis meses pasar del lanzamiento inicial a una calidad consistentemente publicable. Google probablemente tarde lo mismo. Lo más estructuralmente significativo es lo que el lanzamiento dice sobre el negocio de Microsoft 365 y Google Workspace. Si la generación de archivos profesionales se normaliza desde IAs gratuitas, el valor de pagar 12-22 dólares al mes por Microsoft 365 o Google Workspace se reduce. La defensa de ambos es la integración (colaboración en tiempo real, control de versiones, permisos enterprise, compliance), pero esa defensa funciona solo en empresas. El usuario doméstico o el autónomo que paga 8-10 dólares al mes por Microsoft 365 personal puede racionalmente preguntarse si necesita la suite cuando Gemini genera los archivos gratis. La pregunta a 12 meses no es si Gemini va a desplazar a Microsoft 365 (no lo va a hacer; los pagadores son empresas) sino si Microsoft y Google van a tener que reconvertir sus suites de «herramientas para crear archivos» a «infraestructura colaborativa con IA integrada». Mi predicción es que Microsoft 365 va a integrar más profundamente Copilot generando archivos directamente desde conversación (mismo movimiento de Gemini, pero dentro del entorno) antes del cierre de 2026, y que Google Workspace va a unificar Gemini standalone con Workspace integrado para que la frontera entre «app de chat» y «suite de oficina» se vuelva irrelevante. Cuando eso ocurra, la pregunta de qué asistente eliges se reducirá a qué ecosistema usas, no a qué asistente es mejor. La integración va a ganar a la calidad de modelo.
Preguntas frecuentes
¿Cuánto cuesta usar la generación de archivos en Gemini? Cero. La función está disponible globalmente para todos los usuarios de la app de Gemini, incluido el plan gratuito. No requiere suscripción a Google AI Pro ni a Workspace. Es la primera vez que Google ofrece capacidades de generación de archivos sin restricción de plan, lo que la diferencia de la integración previa de Gemini en Workspace (que sí requería plan AI Ultra o Pro).
¿Qué formatos de archivo soporta Gemini exactamente? Workspace nativos (Google Docs, Sheets, Slides), Microsoft Office (Word .docx, Excel .xlsx, PowerPoint .pptx aunque en algunos casos se exporta vía Slides), PDF, CSV, LaTeX, TXT (texto plano), RTF (Rich Text Format) y MD (Markdown). El soporte de LaTeX es especialmente útil para usuarios académicos y técnicos.
¿Cómo se compara con ChatGPT y Claude? ChatGPT genera archivos vía Code Interpreter y Canvas pero con la función repartida entre herramientas distintas. Claude (Anthropic) genera Word, Excel, PowerPoint y PDF directamente desde la conversación, disponible en plan gratuito desde febrero de 2026 con descarga o guardado en Drive y límite de 30 MB. Gemini llega como tercero pero con la ventaja de disponibilidad global gratuita, soporte nativo de LaTeX, e integración profunda con Workspace para apertura directa de archivos generados.
Preguntas frecuentes
¿Qué tipos de archivo puede crear Gemini desde la conversación?
Excel (.xlsx) con varias hojas y fórmulas, PDF maquetado tipo informe, PowerPoint (.pptx) editable en Slides, documentos largos en formato Word y código en lenguajes como Python, JavaScript o SQL. La generación funciona dentro del propio chat, sin abrir Docs, Sheets o Slides.
¿Funciona en el plan gratuito o solo en Google AI Pro?
Está disponible en el plan gratuito de Gemini desde finales de abril de 2026 según el blog oficial de Google. AI Pro y AI Ultra mantienen ventajas en cuota diaria, contexto extendido y prioridad de cola, pero la creación de archivos no es exclusiva de pago.
¿En qué se diferencia de ChatGPT y de Claude para crear archivos?
ChatGPT genera los mismos formatos vía Code Interpreter en planes Plus, Team, Business y Enterprise desde junio de 2025. Claude (Anthropic) los genera en plan gratuito desde febrero de 2026 con descarga directa o guardado en Drive y un límite de 30 MB. Gemini llega como tercero pero con la ventaja de disponibilidad gratuita global, soporte nativo de LaTeX e integración profunda con Workspace.
¿Qué tamaño máximo soporta y dónde se descarga el archivo?
El límite por archivo generado en Gemini se sitúa en torno a los 30 MB, alineado con el de Claude. Cada archivo aparece como tarjeta descargable dentro del propio mensaje y se puede abrir directamente en Google Drive si la cuenta lo tiene activado.
