OpenAI lanza GPT-4o mini, el sustituto de GPT-3.5 en ChatGPT

Publicado el

Imagen minimalista y divertida del lanzamiento de OpenAI's GPT-4o mini, con un pequeño robot alegre interactuando con elementos tecnológicos como una computadora, imágenes y símbolos de texto. Fondo limpio y colores suaves y vibrantes.

El jueves, OpenAI anunció el lanzamiento de GPT-4o mini, una versión más pequeña y asequible de su modelo de lenguaje GPT-4o. Este nuevo modelo reemplazará a GPT-3.5 Turbo en ChatGPT y estará disponible desde hoy para los usuarios gratuitos, así como para aquellos con suscripciones a ChatGPT Plus o Team. Para los usuarios de ChatGPT Enterprise, llegará la próxima semana.

¿Qué es GPT-4o mini?

GPT-4o mini
Uso de GPT-4o mini en la API

GPT-4o mini es una versión reducida del modelo de inteligencia artificial GPT-4o. Al igual que su hermano mayor, es multimodal, lo que significa que puede interpretar tanto imágenes como texto. Además, puede utilizar DALL-E 3 para generar imágenes, lo que amplía enormemente sus capacidades.

OpenAI ha implementado una técnica llamada «jerarquía de instrucciones» en GPT-4o mini. Esta técnica permite que el modelo priorice ciertas instrucciones sobre otras, como las provenientes de una empresa. Esto podría dificultar los ataques de inyección de prompts o jailbreaks, que buscan subvertir los ajustes finos o directrices integradas.

La importancia de los modelos de lenguaje más pequeños

No es la primera vez que una empresa lanza una versión más pequeña de un modelo de lenguaje existente. Es una práctica común en la industria de la inteligencia artificial. Compañías como Meta, Google y Anthropic también han seguido este camino. Los modelos más pequeños están diseñados para realizar tareas más simples a un menor costo, como hacer listas, resumir o sugerir palabras, en lugar de realizar un análisis profundo.

Los modelos de lenguaje de gran tamaño (LLM) con menos parámetros requieren menos cálculos para funcionar, lo que significa que necesitan menos potencia de GPU o pueden hacer menos cálculos en el hardware existente. Esto lleva a facturas de energía más baratas y un menor costo final para el usuario.

Ventajas y limitaciones

A pesar de tener menos parámetros, los modelos como GPT-4o mini pueden ser extremadamente eficaces si están bien entrenados. La calidad de los datos de entrenamiento, la eficiencia de la arquitectura del modelo y el proceso de entrenamiento mismo impactan en su rendimiento. Un ejemplo de esto es Microsoft Phi-3, un modelo pequeño pero muy capaz.

La idea es que, aunque tengan una red neuronal más pequeña, estos modelos aún puedan realizar tareas útiles de manera eficiente. Esto es particularmente importante para aplicaciones que no necesitan el poder completo de los modelos más grandes, permitiendo un uso más económico y accesible de la inteligencia artificial.

Implicaciones para los usuarios de ChatGPT

Para los usuarios de ChatGPT, la llegada de GPT-4o mini promete varias ventajas. Por un lado, su uso gratuito supone un ahorro significativo. Además, su capacidad multimodal abre nuevas posibilidades para la creación de contenido y la interacción con la inteligencia artificial.

En mi opinión, esta es una excelente noticia para todos los usuarios de ChatGPT. La flexibilidad y accesibilidad de GPT-4o mini permitirán que más personas puedan beneficiarse de las últimas tecnologías de inteligencia artificial sin incurrir en altos costos.

En WWWhatsnew.com, siempre estamos atentos a las últimas novedades en tecnología. El lanzamiento de GPT-4o mini es un ejemplo perfecto de cómo la industria de la inteligencia artificial continúa innovando y adaptándose a las necesidades de los usuarios. Este tipo de avances no solo democratizan el acceso a la tecnología, sino que también promueven un uso más sostenible y económico de los recursos.

OpenAI está dando un paso importante con GPT-4o mini. No solo ofrece una alternativa más económica a los modelos más grandes, sino que también mantiene un alto nivel de rendimiento y capacidad. Este movimiento podría marcar una tendencia hacia modelos más accesibles y eficientes, beneficiando a una audiencia más amplia.

Comparte en: