Trabajando con modelos de lenguaje de gran escala: Principios y mejores prácticas

Juan Diego Polo

hace 2 años

Los Modelos de Lenguaje de Gran Escala (LLMs, por sus siglas en inglés) son una tecnología poderosa que permite a los desarrolladores crear aplicaciones de manera rápida y eficiente. Aunque hay mucha información en internet sobre el uso de LLMs en la interfaz de usuario de ChatGPT, en este artículo nos centraremos en las bases del uso de LLMs para ir enfocándonos en el futuro en el desarrollo de aplicaciones de software mediante llamadas API.

Para ayudarnos en esta tarea, estamos haciendo el curso ChatGPT Prompt Engineering for Developers, donde Isa Fulford, miembro del equipo técnico de OpenAI, cuenta detalles sobre el tema.

LLMs Base y LLMs orientados a instrucciones

Existen dos tipos de LLMs: los LLMs base y los LLMs orientados a instrucciones (base LLMs e instruction tuned LLMs) Los primeros están entrenados para predecir la siguiente palabra en función de los datos de entrenamiento de texto, mientras que los segundos están diseñados para seguir instrucciones. Los LLMs para instrucciones son más adecuados para la mayoría de las aplicaciones prácticas, ya que suelen generar textos más útiles, honestos y seguros en comparación con los LLMs base.

Principios de una buena instrucción

Cuando utilizamos un LLM orientado a instrucciones, es importante proporcionar instrucciones claras y específicas, como si estuviéramos dándoles a otra persona. Por ejemplo, si queremos que el LLM genere texto sobre Alan Turing, debemos especificar si queremos que se centre en su trabajo científico, su vida personal o su papel en la historia, y qué tono queremos que tenga el texto. También es útil especificar qué fragmentos de texto debe leer el LLM antes de escribir el texto.

Otro principio importante es darle tiempo al LLM para que piense. A diferencia del software tradicional, los LLMs pueden tardar unos segundos en generar texto, especialmente si las instrucciones son complejas. Por lo tanto, es importante ser paciente y permitir que el LLM haga su trabajo.

Uso común de LLMs

Los LLMs pueden ser utilizados para una variedad de aplicaciones, incluyendo la creación de resúmenes, la inferencia, la transformación y la expansión de texto. Los desarrolladores pueden aprovechar las capacidades del LLM para crear chatbots y otras aplicaciones que puedan comprender y generar texto con un alto nivel de precisión.

Mejores prácticas para el desarrollo de software con LLMs

Al utilizar LLMs en el desarrollo de aplicaciones de software, hay algunas mejores prácticas que los desarrolladores deben seguir.

Se recomienda utilizar LLMs afinados para instrucciones, ya que son más seguros y generan textos más útiles y honestos en comparación con los LLMs base.
Proporcionar instrucciones claras y específicas al LLM, como si estuviéramos dándoles a otra persona, es esencial para generar textos precisos y útiles. El primer principio para mejorar la comunicación con los modelos de lenguaje natural es dar instrucciones claras y específicas. Esto implica proporcionar al modelo un conjunto preciso de instrucciones que le permitan comprender la tarea que se le asigna. Al proporcionar instrucciones claras y específicas, el modelo puede proporcionar resultados precisos y satisfactorios.
Darle tiempo al LLM para que piense y genere texto es importante, ya que los LLMs pueden tardar unos segundos en procesar las instrucciones y generar el texto correspondiente. El segundo principio para mejorar la comunicación con los modelos de lenguaje natural es dar tiempo al modelo para pensar. Algunas tareas pueden ser demasiado complejas para que el modelo las resuelva en un corto periodo de tiempo. Dar tiempo al modelo para que piense y resuelva las tareas en un periodo más prolongado puede mejorar significativamente los resultados.

Además de estas mejores prácticas, es importante que los desarrolladores tengan en cuenta la seguridad y la privacidad al utilizar LLMs. Dado que los LLMs están entrenados en grandes cantidades de datos, es posible que generen textos que contengan información confidencial o datos personales. Por lo tanto, los desarrolladores deben asegurarse de que los textos generados no violen la privacidad de los usuarios.

Tácticas

1. Proporcionar ejemplos de éxito

Una táctica para seguir el primer principio de dar instrucciones claras y específicas es proporcionar ejemplos de éxito. Al mostrar al modelo ejemplos de éxito, puede comprender mejor la tarea que se le asigna y proporcionar mejores resultados.

2. Especificar los pasos necesarios

Una táctica para seguir el segundo principio de dar tiempo al modelo para pensar es especificar los pasos necesarios. Al desglosar una tarea en pasos específicos, el modelo puede tomarse el tiempo necesario para pensar en cada paso y proporcionar resultados precisos.

3. Instruir al modelo a trabajar en su propia solución

Una táctica para seguir el segundo principio de dar tiempo al modelo para pensar es instruir al modelo a trabajar en su propia solución. Al pedirle al modelo que trabaje en su propia solución antes de proporcionar una respuesta, el modelo puede comprender mejor la tarea y proporcionar resultados más precisos.

4. Pedir al modelo que encuentre citas relevantes

Una táctica para seguir el tercer principio de evitar las «alucinaciones» es pedir al modelo que encuentre citas relevantes. Al encontrar citas relevantes, el modelo puede proporcionar respuestas más precisas y basadas en hechos.

5. Entrenar al modelo con conjuntos de datos específicos

Una táctica adicional para mejorar la comunicación con los modelos de lenguaje natural es entrenar al modelo con conjuntos de datos específicos.

Entrenar modelos de lenguaje con conjuntos de datos específicos es una práctica común en el aprendizaje automático. Esto implica proporcionar al modelo un conjunto de datos que esté específicamente diseñado para el tipo de tarea que se le está pidiendo que realice.

En el caso de los modelos de lenguaje, esto puede incluir conjuntos de datos de texto que estén específicamente relacionados con un dominio de conocimiento particular, como el lenguaje médico o legal. Al proporcionar al modelo un conjunto de datos específico, el modelo puede aprender a manejar mejor las sutilezas y complejidades de ese dominio específico.

Por ejemplo, si se está construyendo un modelo de lenguaje para responder preguntas médicas, es importante entrenarlo con un conjunto de datos específico que contenga terminología médica y ejemplos de preguntas y respuestas médicas. Esto ayudará al modelo a comprender mejor las preguntas y a generar respuestas precisas y útiles para los usuarios.

Entrenar al modelo con conjuntos de datos específicos también puede ayudar a reducir la posibilidad de que el modelo produzca respuestas inexactas o irrelevantes. Si se entrena al modelo con datos genéricos, puede tener dificultades para comprender las preguntas y generar respuestas precisas. Al proporcionar al modelo datos específicos, se le está dando la oportunidad de aprender sobre el dominio específico y mejorar su capacidad para responder preguntas relacionadas con ese dominio.

Sin embargo, es importante tener en cuenta que entrenar al modelo con conjuntos de datos específicos también puede limitar su capacidad para manejar situaciones fuera del dominio específico. Si el modelo se entrena solo con datos médicos, por ejemplo, puede tener dificultades para responder preguntas sobre otros temas. Por lo tanto, es importante encontrar un equilibrio entre proporcionar al modelo datos específicos y permitirle tener cierta flexibilidad para responder a una variedad de preguntas y situaciones.

El uso de LLMs en el desarrollo de aplicaciones de software tiene un gran potencial para mejorar la eficiencia y la precisión de las aplicaciones. Sin embargo, también es importante tener en cuenta los riesgos y las implicaciones éticas del uso de esta tecnología. Los desarrolladores deben trabajar para garantizar que sus aplicaciones sean seguras y respeten la privacidad de los usuarios.

Seguiremos tratando el tema en el futuro, poco a poco, para que acabéis desarrollando fácilmente vuestra primera aplicación IA.