La plataforma de desarrollo Cursor, que ha ganado popularidad por integrar inteligencia artificial en el flujo de trabajo de programadores, acaba de presentar su primer modelo de lenguaje propio: Composer. Se trata de un paso significativo para una empresa que hasta ahora dependía de modelos de terceros, como los de OpenAI, y que ahora apuesta por un enfoque más autónomo y adaptado a su producto. Continúa leyendo «Cursor lanza Composer, su primer LLM propio, prometiendo cuadruplicar la velocidad de programación»
Etiqueta: modelo de lenguaje
Alibaba presenta Qwen3-Max: un modelo de IA con un billón de parámetros que reabre el debate sobre el tamaño y la eficiencia
Alibaba ha dado un paso más en su apuesta por la inteligencia artificial al presentar Qwen3-Max, el modelo de lenguaje más grande de su historia, con más de un billón de parámetros. Este nuevo modelo forma parte de la serie Qwen3, que debutó en mayo de 2025, y destaca por su potencia en tareas de comprensión del lenguaje, razonamiento y generación de texto. Aunque este anuncio llama la atención por el tamaño del modelo, la pregunta de fondo es si realmente más parámetros implican mejor rendimiento. Continúa leyendo «Alibaba presenta Qwen3-Max: un modelo de IA con un billón de parámetros que reabre el debate sobre el tamaño y la eficiencia»
Suiza lanza Apertus, su propio modelo de IA de código abierto
En el escenario actual dominado por grandes compañías tecnológicas, Suiza ha decidido tomar un camino diferente. Lejos de depender exclusivamente de modelos comerciales como los de OpenAI o Google, el país alpino ha desarrollado Apertus, su propio modelo de lenguaje de gran escala (LLM, por sus siglas en inglés). La iniciativa no es de una empresa, sino de un conjunto de instituciones públicas: el Instituto Federal Suizo de Tecnología de Lausana (EPFL), ETH Zurich y el Centro Nacional Suizo de Supercomputación (CSCS). Continúa leyendo «Suiza lanza Apertus, su propio modelo de IA de código abierto»
ByteDance lanza Seed-OSS-36B: un modelo de lenguaje abierto con contextos de hasta 512.000 tokens
ByteDance, la empresa matriz de TikTok, ha dado un paso relevante en el competitivo mundo de la inteligencia artificial con la presentación de Seed-OSS-36B, una nueva familia de modelos de lenguaje de código abierto (LLM). Desarrollado por el equipo Seed, esta propuesta busca posicionarse como una alternativa robusta y versátil frente a soluciones de gigantes como OpenAI o Anthropic. La apuesta no solo destaca por su rendimiento, sino también por su enfoque accesible y su capacidad para manejar contextos de hasta 512.000 tokens, una cifra que dobla el límite de modelos como GPT-5. Continúa leyendo «ByteDance lanza Seed-OSS-36B: un modelo de lenguaje abierto con contextos de hasta 512.000 tokens»
Claude ahora puede terminar conversaciones abusivas: el nuevo enfoque de Anthropic sobre el «bienestar de modelos»
Anthropic ha anunciado una actualización significativa en sus modelos de lenguaje más avanzados, Claude Opus 4 y 4.1, que ahora pueden terminar conversaciones en casos extremos de interacciones abusivas o dañinas. Este cambio no se ha diseñado para proteger al usuario, como suele ser el objetivo en la mayoría de los desarrollos de seguridad en IA, sino que está dirigido a proteger al propio modelo. Continúa leyendo «Claude ahora puede terminar conversaciones abusivas: el nuevo enfoque de Anthropic sobre el «bienestar de modelos»»
LangExtract: la nueva biblioteca de Google para extraer información con IA de forma estructurada y confiable
Con el anuncio de LangExtract, Google presenta una herramienta que podría cambiar la forma en que procesamos grandes volúmenes de texto sin estructurar. Esta biblioteca de código abierto, basada en modelos de lenguaje como Gemini, está diseñada para ayudar a desarrolladores a extraer información de manera precisa, organizada y trazable, sin necesidad de entrenar modelos desde cero.
A continuación, te explicamos qué es LangExtract, cómo funciona, en qué se diferencia de otras herramientas de procesamiento de lenguaje natural y por qué podría ser clave para tareas en sectores como la medicina, el derecho o las finanzas. Continúa leyendo «LangExtract: la nueva biblioteca de Google para extraer información con IA de forma estructurada y confiable»
Grok 4: el nuevo modelo de IA de xAI que apunta a competir con ChatGPT y Gemini
Elon Musk y su empresa de inteligencia artificial, xAI, han presentado oficialmente Grok 4, una nueva versión de su modelo de lenguaje, junto a un sorprendente plan de suscripción premium de 300 dólares mensuales llamado SuperGrok Heavy. Esta nueva etapa busca posicionar a Grok como una alternativa sólida frente a los gigantes del sector como OpenAI, Google y Anthropic. Continúa leyendo «Grok 4: el nuevo modelo de IA de xAI que apunta a competir con ChatGPT y Gemini»
Microsoft presenta Mu: su nuevo modelo de IA que mejora la configuración en Windows 11
Windows 11 ha dado un paso hacia una experiencia más intuitiva y personalizada con la incorporación de Mu, un modelo de inteligencia artificial desarrollado por Microsoft. Este modelo funciona de forma local en los equipos Copilot+ y ha sido diseñado para facilitar el acceso y modificación de ajustes dentro del sistema operativo, usando lenguaje natural. A continuación, repasamos las características técnicas y funcionales de Mu, y cómo está cambiando la forma en que interactuamos con Windows. Continúa leyendo «Microsoft presenta Mu: su nuevo modelo de IA que mejora la configuración en Windows 11»
Demuestran que es posible entrenar modelos de IA sin usar material con derechos de autor
En un entorno donde la industria de la inteligencia artificial avanza a pasos de gigante, un grupo de investigadores ha demostrado que es posible entrenar modelos de lenguaje sin recurrir a contenido protegido por derechos de autor. La hazaña no solo ofrece una alternativa más ética, sino que también contradice afirmaciones previas de gigantes tecnológicos como OpenAI, que sostenían que esta posibilidad era inviable. Continúa leyendo «Demuestran que es posible entrenar modelos de IA sin usar material con derechos de autor»
Microsoft integra Grok 3 en Azure: una alianza controvertida entre IA potente y gestión empresarial
Grok 3, el modelo de inteligencia artificial desarrollado por xAI, la startup de Elon Musk, ya está disponible en Microsoft Azure AI Foundry, una noticia que marca un nuevo capítulo en la colaboración entre grandes tecnológicas y proyectos de IA que desafían los estándares tradicionales. Esta incorporación genera entusiasmo y dudas a partes iguales, dado el historial del modelo Grok y su estilo provocador. Continúa leyendo «Microsoft integra Grok 3 en Azure: una alianza controvertida entre IA potente y gestión empresarial»