Etiqueta: Benchmark

Apple pone en duda las verdaderas capacidades de razonamiento de los modelos de IA más avanzados

Publicado el 11 junio, 2025

La investigación más reciente del equipo de inteligencia artificial de Apple ha generado un fuerte revuelo en el mundo de la tecnología. No porque se trate de una nueva funcionalidad para el iPhone o una actualización de Siri, sino por una publicación científica que cuestiona directamente las capacidades de razonamiento de los modelos de lenguaje más avanzados que lideran el mercado. Continúa leyendo «Apple pone en duda las verdaderas capacidades de razonamiento de los modelos de IA más avanzados»

Nuevo benchmark de IA mide cuánto mienten los modelos

Publicado el 13 marzo, 2025

por Natalia Polo

La inteligencia artificial ha avanzado a pasos agigantados, pero con ello han surgido preocupaciones sobre su transparencia y veracidad. Ahora, un nuevo estudio ha introducido un benchmark de IA inédito, conocido como MASK (Model Alignment between Statements and Knowledge), diseñado para evaluar cuánto pueden mentir los modelos de IA y cuán honestos son realmente con los usuarios.

Continúa leyendo «Nuevo benchmark de IA mide cuánto mienten los modelos»

¿Es China el nuevo líder en Inteligencia Artificial? Así es Baichuan 2-13B

Publicado el 15 septiembre, 2023

por Juan Diego Polo

La reciente aparición de Baichuan 2-13B, un modelo de lenguaje chino, ha generado un debate en la comunidad tecnológica. Este modelo no solo ha mostrado un rendimiento impresionante, sino que también ha superado a ChatGPT en AGIEval, un benchmark de Microsoft. Pero, ¿qué significa realmente este logro? Continúa leyendo «¿Es China el nuevo líder en Inteligencia Artificial? Así es Baichuan 2-13B»