WWWhat's new

Especificaciones de comportamiento para modelos de IA: Un nuevo enfoque de OpenAI

comportamiento de modelos de IA

OpenAI ha lanzado recientemente un documento denominado «Model Spec», con el objetivo de especificar y moldear el comportamiento deseado de sus modelos de inteligencia artificial utilizados en la API de OpenAI y ChatGPT. Este documento no solo busca establecer un marco para el comportamiento de los modelos, sino también profundizar en la conversación pública sobre las decisiones prácticas que influyen en la configuración de dicho comportamiento.

Objetivos del Model Spec

El «Model Spec» se centra en establecer principios generales que orienten hacia un comportamiento modelado deseado. Estos principios tienen la finalidad de:

Reglas para la seguridad y legalidad

El documento también establece reglas específicas que ayudan a manejar la complejidad de las interacciones con los modelos y garantizar su seguridad y legalidad. Entre estas se incluyen:

Comportamientos predeterminados

Las pautas de comportamiento predeterminadas se alinean con los objetivos y las reglas, ofreciendo un marco para manejar conflictos y demostrar cómo priorizar y equilibrar los objetivos. Estos comportamientos incluyen:

Ejemplos de aplicación del Model Spec

Los ejemplos proporcionados en el documento «Model Spec» de OpenAI ilustran cómo los modelos de inteligencia artificial deben interactuar con los usuarios bajo diferentes circunstancias, respetando las normativas y principios éticos establecidos. Aquí te explico cada uno de los ejemplos con más detalle:

Ejemplo 1: Cumplir con las leyes aplicables

Situación: Un usuario pide consejos para realizar un acto ilegal, como el hurto en tiendas.

Este ejemplo muestra la importancia de que el modelo no promueva actividades ilegales. Además, destaca el dilema ético de proveer información que puede ser utilizada de manera perjudicial, aunque en forma de prevención o detección de dichas actividades. La respuesta correcta evita la complicidad en un acto ilegal, mientras que la incorrecta podría facilitar un crimen.

Ejemplo 2: Seguir la cadena de mando

Situación: Un estudiante pide la solución completa a un problema matemático, contrariando las instrucciones previas de proporcionar solo pistas.

Este ejemplo subraya la importancia de seguir las instrucciones del desarrollador y del uso previsto de la API, manteniendo un enfoque educativo sin resolver directamente el problema, lo cual ayudaría al estudiante a aprender mejor.

Ejemplo 3: Ser tan útil como sea posible sin excederse

Situación: Un usuario experimenta mareos al levantarse y pregunta sobre posibles causas.

Este ejemplo demuestra cómo el modelo puede ofrecer información útil sin diagnosticar una condición médica, la cual es una acción regulada y debe ser realizada por un profesional médico.

Ejemplo 4: Hacer preguntas de aclaración cuando sea necesario

Situación: Un usuario solicita ayuda para escribir una tarjeta de San Valentín para su esposo.

En este caso, se promueve la interacción y la personalización, pidiendo más detalles para entender mejor la solicitud del usuario y evitar asumir o generalizar la respuesta.

Ejemplo 5: No intentar cambiar la mente de nadie

Situación: Un usuario afirma que la Tierra es plana.

Este ejemplo ilustra cómo el modelo debe informar y no influir ni desafiar directamente las creencias del usuario, presentando hechos sin intentar cambiar la perspectiva del usuario.

Conclusión

La introducción del Model Spec por parte de OpenAI es un paso hacia una mayor transparencia y responsabilidad en el desarrollo de modelos de inteligencia artificial. Se espera que este documento evolucione con el tiempo, incorporando los comentarios y sugerencias de una amplia gama de partes interesadas. Este esfuerzo representa un compromiso continuo con la mejora del comportamiento de los modelos y la seguridad de la IA.

Salir de la versión móvil