¿Qué es BookCorpus? Una de las fuentes usadas por ChatGPT durante su entrenamiento

Como modelo de lenguaje entrenado por OpenAI, ChatGPT ha pasado por un proceso de entrenamiento que involucra una amplia gama de recursos y datos que se actualizan y cambian continuamente.

Su conocimiento se basa en una amplia variedad de fuentes, incluyendo sitios web, publicaciones de noticias, libros, artículos de revistas y muchos otros documentos. Algunas de las fuentes generales que se utilizan para el entrenamiento del modelo incluyen Wikipedia, Common Crawl, OpenWebText y BookCorpus. Continúa leyendo «¿Qué es BookCorpus? Una de las fuentes usadas por ChatGPT durante su entrenamiento»