Google ha anunciado nuevas actualizaciones para su familia de modelos Gemini 2.5, presentando oficialmente la versión Gemini 2.5 Flash-Lite, un modelo que destaca por su bajo coste, velocidad y capacidad de procesamiento a gran escala.
¿Qué es Gemini 2.5 Flash-Lite?
Gemini 2.5 Flash-Lite es un modelo de lenguaje orientado a tareas de alto rendimiento como clasificación y resumen de textos. A diferencia de versiones anteriores, esta versión está pensada para casos de uso donde se requiere gran volumen de procesamiento a bajo coste y con la menor latencia posible.
Podemos imaginarlo como un «modo ahorro» de los modelos de lenguaje: consume menos, responde más rápido y es suficientemente inteligente para tareas estructuradas, sin la necesidad de toda la potencia que ofrece su hermano mayor, Gemini 2.5 Pro.
Características principales de Flash-Lite
- Latencia mínima: genera la primera palabra rápidamente y procesa más tokens por segundo que sus antecesores.
- Costo reducido: es la opción más barata de toda la línea 2.5.
- Pensamiento controlado: permite ajustar el «presupuesto de pensamiento» mediante parámetros API. Por defecto, está desactivado para optimizar la velocidad.
- Compatibilidad total con herramientas nativas como:
- Grounding con Google Search
- Ejecución de código
- Contexto por URL
- Function calling
Esta versión está en fase de preview, pero ya disponible para ser utilizada en proyectos reales.
Comparación con otros modelos Gemini
Google ofrece actualmente tres versiones estables o en preview de su tecnología Gemini 2.5:
- Gemini 2.5 Pro: el modelo más completo, ideal para tareas complejas como programación o agentes inteligentes.
- Gemini 2.5 Flash: equilibrio entre coste e inteligencia, ya disponible en versión estable.
- Gemini 2.5 Flash-Lite: la opción más económica y rápida, orientada a tareas de gran volumen.
Mientras que Pro es el «cerebro analítico» y Flash el «todoterreno», Flash-Lite se comporta como el «mensajero rápido» que realiza tareas simples a toda velocidad.
Cambios en los precios de Gemini 2.5 Flash
Junto al lanzamiento de Flash-Lite, Google también ha ajustado los precios de Gemini 2.5 Flash, buscando simplificar la estructura y reflejar mejor el valor que ofrece:
- Entrada: $0.30 por cada 1M tokens (antes $0.15)
- Salida: $2.50 por cada 1M tokens (antes $3.50)
- Se eliminan las tarifas diferenciadas entre respuestas con y sin «pensamiento».
- Precio único sin importar el tamaño del input.
Estos ajustes responden a la necesidad de ofrecer una mejor relación coste-inteligencia y facilitar la adopción del modelo sin confundir a los desarrolladores con variables adicionales.
Disponibilidad y transiciones
- Gemini 2.5 Flash y Pro están ya disponibles como versiones estables.
- Flash-Lite se puede probar desde ya en modo preview.
- Los usuarios de versiones anteriores (como Flash Preview 04-17 o Pro Preview 05-06) deberán migrar antes del 15 de julio y 19 de junio respectivamente.
Este nuevo escenario de modelos ofrece más flexibilidad a los desarrolladores, que pueden elegir la opción adecuada según sus necesidades de velocidad, coste o inteligencia.
¿Para quién es ideal Flash-Lite?
- Proyectos que requieren procesamiento masivo de textos, como motores de resumen automático de noticias o clasificación de contenido.
- Aplicaciones sensibles a la latencia, como chatbots que deben responder instantáneamente.
- Casos donde se necesita ahorro de costes, sin sacrificar del todo la capacidad de comprensión.
En resumen, Flash-Lite es como una bicicleta de carreras frente a un SUV: no lo usarás para todo, pero en las pistas adecuadas, su rendimiento es inmejorable.
