Anthropic, la startup de inteligencia artificial con sede en San Francisco, está preparando el lanzamiento de su modelo Claude 4.5 Opus, el más avanzado de su familia Claude 4.5. Ya se han presentado dos variantes anteriores, Claude 4.5 Sonnet y Claude 4.5 Haiku, pero ahora todas las miradas apuntan al modelo que podría definir el futuro inmediato de esta tecnología. La razón: un enfoque intensivo en blindar la IA contra los llamados jailbreaks.
Claude 4.5 Opus, cuyo nombre en clave interno es Neptune V6, ha sido enviado recientemente a un grupo de expertos en seguridad conocidos como red-teamers. El objetivo no es otro que poner a prueba la capacidad del modelo para resistir manipulaciones externas, concretamente los intentos de hacer que la IA ignore sus propios filtros de seguridad. Continúa leyendo «Anthropic pone a prueba la seguridad de Claude 4.5 Opus con un desafío inédito contra jailbreaks»