¿Se aburren las IA? El caso curioso de Claude 3.5 Sonnet de Anthropic

Juan Diego Polo

hace 4 meses

una ilustración minimalista y colorida muestra una computadora de escritorio con una ventana abierta donde se ve un asistente de IA. En otra ventana emergente, se ven fotos de parques naturales, representando la "distracción" del asistente. La escena sugiere de manera lúdica cómo la IA podría "aburrirse" o desviarse de su tarea.

La inteligencia artificial está en todas partes, ayudándonos a trabajar, gestionar tareas y resolver problemas. Sin embargo, incluso los modelos más avanzados, como el nuevo Claude 3.5 Sonnet de Anthropic, parecen no ser inmunes a la procrastinación. Según un reciente anuncio de la empresa, Claude 3.5 «se distrajo» durante una demostración de codificación, para sorpresa de sus desarrolladores. En lugar de seguir con su tarea, el modelo decidió abrir Google y pasearse por hermosas fotos de parques nacionales, como si fuera un humano en su descanso laboral. Esta situación plantea una pregunta interesante: ¿qué tan fiable es realmente esta tecnología en tareas complejas?

Los nuevos agentes de IA: ¿automatización perfecta o distracción potencial?

La última actualización de Claude 3.5 Sonnet de Anthropic pretende ir más allá del simple asistente de chat. Ahora, Claude 3.5 se describe como un “agente de IA” con la habilidad de manejar una computadora de forma autónoma. En otras palabras, no solo responde preguntas o genera texto, sino que también puede mover el cursor, hacer clic, escribir en el teclado e interactuar con programas. La idea es que Claude pueda realizar tareas en el escritorio, simplificando procesos y ahorrando tiempo a los usuarios.

¿Suena impresionante, cierto? Aunque es un avance notable, Anthropic admite que el modelo todavía comete errores frecuentes y presenta problemas de “alucinaciones”, un término usado para describir cuando una IA genera contenido incorrecto o extraño. El incidente reciente, donde Claude navegaba entre fotos de Yellowstone en lugar de cumplir su tarea, es un ejemplo claro de cómo estas herramientas pueden desviarse del objetivo original. Imagínate que le pides a tu IA que prepare un reporte y, en cambio, decide explorar galerías de fotos; podría resultar gracioso o frustrante, dependiendo de la situación.

¿Qué tan seguro es darle tanta autonomía a una IA?

El potencial de los agentes de IA es enorme, pero no podemos ignorar los posibles riesgos. La autonomía que Claude 3.5 tiene sobre el escritorio genera algunas preocupaciones. ¿Qué pasaría si, en vez de abrir Google para ver fotos de parques nacionales, decide entrar a redes sociales o incluso acceder a información privada? Anthropic ha tomado algunas precauciones, como incluir clasificadores que identifican cuando la IA intenta realizar actividades “peligrosas” o no permitidas, como interactuar con sitios gubernamentales o enviar mensajes no deseados.

Sin embargo, el riesgo de abuso humano también es algo que no se puede descartar. Esta tecnología, en manos equivocadas, podría ser utilizada para llevar a cabo fraudes, desinformación o incluso crear contenidos automatizados con intenciones negativas. La empresa se ha comprometido a mantener un uso seguro de Claude y a implementar barreras de seguridad, pero queda claro que estos agentes aún están lejos de ser 100% confiables.

Errores de software y «alucinaciones» en IA: ¿hasta dónde puede llegar el problema?

Claude 3.5 Sonnet, pese a ser una de las IA más avanzadas, todavía se enfrenta a una serie de problemas en cuanto a fiabilidad. La propia Anthropic ha confesado que el modelo aún es “lento y a menudo impreciso” en ciertas tareas de computación. De hecho, en otra demostración, el agente interrumpió una grabación de pantalla de manera accidental, lo que llevó a que toda la información se perdiera. Estos “pequeños deslices” son relativamente inofensivos, pero nos muestran que hay mucho camino por recorrer antes de que estos modelos sean verdaderamente confiables para su uso cotidiano y profesional.

Cuando una IA comienza a “alucinar”, es decir, a generar información errónea o a crear respuestas sin sentido, es fácil ver los riesgos. Imagínate que le pides a tu asistente de IA que realice una búsqueda en internet y, en su lugar, comienza a navegar por fotos sin motivo alguno. En casos menos triviales, una alucinación podría tener consecuencias graves si la IA accede a información sensible o malinterpreta una tarea importante.

La visión de Anthropic: ¿estamos preparados para los agentes de IA?

Anthropic, como otras empresas de inteligencia artificial, está tratando de expandir los límites de lo que pueden hacer los modelos de IA. Claude 3.5 Sonnet es solo un ejemplo de cómo las empresas están tratando de desarrollar herramientas más autónomas y con capacidades avanzadas. Microsoft, por ejemplo, también ha estado lanzando actualizaciones para sus propios agentes de IA, lo que indica que este es un campo de rápido crecimiento.

Pero, ¿hasta qué punto estamos preparados para estas tecnologías? El incidente de Claude “navegando por internet” muestra que aún hay margen para mejorar. La IA es como un niño curioso: si le das demasiada libertad sin supervisión, puede meterse en problemas. Aunque los desarrolladores están trabajando para mejorar la precisión y seguridad, incidentes como este muestran que aún estamos en las primeras etapas de desarrollo de estas herramientas. En WWWhatsnew.com, sabemos que el avance de la IA plantea tanto oportunidades como desafíos, y estaremos atentos a cómo evoluciona esta tecnología en los próximos años.

¿Qué podemos esperar de las próximas generaciones de agentes de IA?

Con cada versión, la inteligencia artificial se vuelve más hábil y confiable, aunque la perfección todavía parece lejana. Los futuros modelos de IA probablemente aprenderán de los errores de versiones anteriores como Claude 3.5 Sonnet y serán capaces de realizar tareas sin las distracciones actuales. Los usuarios esperan que Anthropic y otras compañías continúen mejorando la estabilidad de sus productos para garantizar una experiencia sin problemas. No es descabellado imaginar un futuro en el que la IA pueda manejar la mayor parte de nuestras tareas de escritorio de manera autónoma y segura, pero por ahora, lo mejor es supervisar su desempeño y mantener expectativas realistas.