Web analiza el 4% de todos los libros publicados en la historia

Publicado el

ngram

Un equipo de investigadores de la Universidad de Harvard (EE UU), dirigido por los investigadores Jean-Baptiste Michel y Erez Lieberman Aiden, ha analizado libros digitalizados como ‘genoma cultural’ para cuantificar tendencias culturales e históricas. La idea es publicar un «registro fósil» digital de la cultura humana.

Comentan en Plataforma Sinc:

Los investigadores han realizado un seguimiento de la frecuencia con la que las palabras aparecen en los libros a lo largo del tiempo para comprender mejor asuntos tan diversos como la memoria colectiva de la humanidad […] realizando un seguimiento de la frecuencia para comprender mejor asuntos tan diversos como la adopción de la tecnologí­a, la dinámica de la fama, y los efectos de la censura y la propaganda.

Durante cuatro años han estado trabajando junto a Google, la Enciclopedia Británica y el American Heritage Dictionary, para ofrecer los datos que podemos bajar en este enlace, donde también ofrecen la posibilidad de analizar los datos mediante gráficos.

Este conjunto de datos, que se puede descargar ahora a través de Internet, es miles de veces mayor que cualquier obra histórica anterior. Se basa en los textos completos de unos 5,2 millones de libros, con más de 500.000 millones de palabras en total

Jon Orwant, director de ingenierí­a de Google Books, comenta:

Ahora que una parte considerable de los libros del mundo se han digitalizado, el análisis con ayuda de ordenadores puede revelar tendencias desconocidas en la historia, la cultura, el lenguaje y el pensamiento

Un impresionante proyecto para analizar el pasao y presente de nuestra sociedad.

Comparte en: