Si alguna vez has pedido ayuda de programación por chat, es probable que hayas escrito como lo harías con una persona: con un tono informal, algún “gracias :)” o una carita para suavizar una petición. El problema es que, para un modelo de lenguaje (un LLM), esa carita no siempre es “solo” una carita. Un estudio reciente describe una vulnerabilidad a la que llama confusión semántica de emoticonos: ciertos emoticonos ASCII pueden interpretarse como parte de la instrucción y desviar la respuesta hacia acciones no deseadas, incluso potencialmente destructivas.
La idea resulta inquietante por lo cotidiana. Es como dejar una nota en la nevera que dice “Compra pan” y dibujar al lado un guiño “;)”. Para ti es un gesto simpático; para alguien que lee con reglas raras, ese guiño podría parecerle un símbolo de “hazlo de otra manera” o “cambia el plan”. En programación, esa “otra manera” puede acabar en un script que toca rutas equivocadas, borra un directorio que no debía o altera permisos sin que te des cuenta a primera vista. Continúa leyendo «Cuando un “:-P” se cuela en el código: el riesgo de los fallos silenciosos en los LLM»