Anthropic ha lanzado un ambicioso programa para financiar el desarrollo de nuevos benchmarks capaces de evaluar el rendimiento y el impacto de los modelos de inteligencia artificial, incluidos los modelos generativos como Claude. Esta iniciativa busca revolucionar la forma en que se mide la seguridad y las capacidades de los sistemas de IA en la industria.
Continúa leyendo «Anthropic: Nuevos benchmarks para la evaluación de modelos de IA»