En un anuncio que promete revolucionar el acceso a los recursos de entrenamiento para modelos de inteligencia artificial (IA), la Universidad de Harvard ha presentado un dataset de alta calidad compuesto por casi un millón de libros de dominio público. Este proyecto ha sido desarrollado por la nueva Iniciativa Institucional de Datos de Harvard (Institutional Data Initiative) con el respaldo financiero de OpenAI y Microsoft. La colección está basada en libros digitalizados como parte del proyecto Google Books, asegurando que estén libres de derechos de autor.