En un reciente artículo publicado en el servidor de preimpresión arXiv, un equipo de investigadores británicos y canadienses advierte sobre el impacto de los modelos de lenguaje en la generación de contaminación verbal.
Estos investigadores exploraron el efecto de las sucesivas generaciones de texto generado por ChatGPT, y llegaron a la conclusión de que esto podría socavar los propios datos en los que se entrenan dichos modelos.