El desarrollo de modelos de inteligencia artificial se ha disparado en los últimos años, pero una de las grandes incógnitas sigue siendo cómo evaluar de forma precisa y sistemática su comportamiento. Con este objetivo en mente, Anthropic ha presentado Bloom, una herramienta de código abierto que permite analizar cómo se comporta un modelo de IA ante distintos escenarios, tanto en condiciones normales como bajo presión.
Bloom no es un modelo de lenguaje, sino un sistema de evaluación diseñado para automatizar una tarea que hasta ahora era lenta y artesanal: someter a los modelos a diferentes situaciones para detectar posibles sesgos, comportamientos peligrosos o respuestas inadecuadas. Continúa leyendo «Bloom: la herramienta de Anthropic para evaluar el comportamiento de modelos de IA»