IA para restaurar textos antiguos y sus vacíos perdidos

Publicado el

texto

Un equipo de investigadores de IA de DeepMind, en colaboración con colegas de la Universidad de Venecia, la Universidad de Oxford y la Universidad de Economía y Negocios de Atenas, ha desarrollado una aplicación de inteligencia artificial (IA) para ayudar a los historiadores a llenar los espacios en blanco del texto que falta en la piedra, artefactos de metal o cerámica.

A través de su investigación, el grupo describe cómo construyeron la aplicación, cómo se puede usar y qué tan bien funcionó cuando se probó con textos conocidos. Charlotte Roueché, del King’s College London, ha publicado un artículo de News and Views en la misma edición de la revista que describe la historia del uso de nuevas tecnologías para comprender mejor los artefactos históricos y el trabajo realizado por el equipo en este nuevo esfuerzo.

Restaurando historias perdidas con IA

Durante ciertos puntos de la historia, los humanos comenzaron a usar texto escrito para propósitos como llevar cuentas. Dichos relatos pueden dar pistas a los eruditos modernos sobre cómo vivían las personas en las sociedades antiguas. Pero eso es solo si los artefactos pueden ser descifrados. Muchos han sido erosionados por el clima o se han roto y les faltan piezas.

Los eruditos modernos usan una variedad de herramientas para determinar el contenido del texto original. Este es casi siempre un proceso largo y tedioso. En este nuevo esfuerzo, el equipo de DeepMind se propuso desarrollar una herramienta para ayudar en tales esfuerzos. El resultado fue Ithaca, una aplicación de aprendizaje automático que aprende de otros textos antiguos para predecir el texto que falta.

Ithaca, según el equipo de DeepMind, es la primera red neuronal profunda que capaz de restaurar el texto faltante de las inscripciones dañadas, identificar su ubicación original y ayudar a establecer la fecha en que se crearon. Ithaca lleva el nombre de la isla griega en la Odisea de Homero y se amplía con Pythia, el anterior sistema desarrollado para estos esfuerzos, que se centró en la restauración textual.

Los investigadores entrenaron la aplicación utilizando 60.000 textos griegos de los años 700 a. C. a 500 d. C. Cada uno ya había sido ampliamente estudiado y reconstruido cuando fue necesario. Luego, el equipo ejecutó la aplicación en los mismos textos antes de la reconstrucción. Luego entrenaron la aplicación en otros 8,000 textos bien estudiados para probarla contra el trabajo realizado por expertos humanos.

Las evaluaciones realizadas por los investigadores muestran que Ithaca logra un 62 % de precisión en la restauración de textos dañados, un 71 % de precisión en la identificación de su ubicación original y puede fechar textos dentro de los 30 años de sus rangos de fecha reales. Los historiadores ya han utilizado la herramienta para reevaluar períodos significativos de la historia griega.

Gracias a una alizanza con Google Cloud y Google Arts & Culture, existe una versión gratuita e interactiva de Ithaca que se puede probar aquí.

El código fuente de Ithaca fue liberado para ser usado en otras investigaciones. Además, el reporte con el detalle de este desarrollo fue publicado recientemente en la revista Nature.