Visión artificial para digitalizar los archivos secretos del Vaticano

archivos secretos

En technologyreview comentan un interesante proyecto que se está realizando con el objetivo de transformar al formato digital a algunos de los millones de documentos existentes en el Archivo Secreto Vaticano, archivo que contiene unos 85 kilómetros de estanterías, con cartas privadas y otros documentos de reyes y papas desde el siglo VIII hasta la actualidad.

El valor histórico de esos documentos es enorme. Hay cartas que sí se han hecho públicas, como algunos juicios de Caballeros Templarios, cartas del artista Miguel Ángel, solicitaciones de anulaciones matrimoniales de reyes, peticiones de ayuda de grandes personajes de la historia… hay incluso cartas de Abraham Lincoln y Jefferson Davis, pero todo lo que es posterior a 1939, es secreto.

Transcribir esa información es prácticamente imposible, por lo que se podría usar un sistema de visión artificial dentro de un proyecto propuesto llamado In Codice Ratio (“El Código del Sistema”, en latín), con una plataforma que sería capaz de transcribir automáticamente una parte del Archivo: más de 18.000 páginas de cartas del siglo XIII entre la Iglesia Católica y reyes.

Necesitan de un sistema de reconocimiento óptico capaz de reconocer caracteres que combinan letras adyacentes y abreviaturas antiguas, y no es fácil crear conjuntos de datos para entrenar a los ordenadores, por lo que problemas no faltan. Ahora han creado un sistema óptico que divide cada palabra en una serie de trazos que encajan como un rompecabezas, de forma que consiguen unirlos para formar letras conocidas analizando por fin el resultado para ver si tiene sentido, una técnica que sí está dando resultado.

Han obtenido la ayuda de 120 estudiantes de educación secundaria que etiquetaron patrones y conjuntos de datos de entrenamiento de 15.000 caracteres a mano en un par de horas, y los ordenadores han conseguido así transcribir con exactitud el 65 % de las imágenes, de los trozos de letras obtenidos de los pergaminos.

Aunque el resultado no se publique, la técnica puede ayudar mucho a mantener a salvo la información, con la esperanza de que en un futuro podamos conocer mejor la historia de la humanidad a partir de las cartas de sus “protagonistas”.

Juan Diego Polo

Estudió Ingeniería de Telecomunicaciones en la UPC (Barcelona), trabajando como ingeniero, profesor y analista desde 1998 hasta 2005, cuando decidió emprender creando wwwhatsnew.com.