Nuevo benchmark de IA mide cuánto mienten los modelos

La inteligencia artificial ha avanzado a pasos agigantados, pero con ello han surgido preocupaciones sobre su transparencia y veracidad. Ahora, un nuevo estudio ha introducido un benchmark de IA inédito, conocido como MASK (Model Alignment between Statements and Knowledge), diseñado para evaluar cuánto pueden mentir los modelos de IA y cuán honestos son realmente con los usuarios.

Continúa leyendo «Nuevo benchmark de IA mide cuánto mienten los modelos»

¿Es China el nuevo líder en Inteligencia Artificial? Así es Baichuan 2-13B

La reciente aparición de Baichuan 2-13B, un modelo de lenguaje chino, ha generado un debate en la comunidad tecnológica. Este modelo no solo ha mostrado un rendimiento impresionante, sino que también ha superado a ChatGPT en AGIEval, un benchmark de Microsoft. Pero, ¿qué significa realmente este logro? Continúa leyendo «¿Es China el nuevo líder en Inteligencia Artificial? Así es Baichuan 2-13B»