Anthropic: Nuevos benchmarks para la evaluación de modelos de IA
Anthropic ha lanzado un ambicioso programa para financiar el desarrollo de nuevos benchmarks capaces de evaluar el rendimiento y el impacto de los modelos de inteligencia artificial, incluidos los modelos generativos como Claude. Esta iniciativa busca revolucionar la forma en que se mide la seguridad y las capacidades de los sistemas de IA en la… <a href="https://wwwhatsnew.com/2024/07/02/anthropic-nuevos-benchmarks-para-la-evaluacion-de-modelos-de-ia/">Continúa leyendo »</a>