Usando la inteligencia artificial, investigadores enseñan a una computadora a leer los archivos secretos del Vaticano

(Tom Kington | Los Ángeles Times).- Cuando los custodios en los Archivos Secretos del Vaticano orgullosamente dicen “La historia del mundo entero está aquí”, no están bromeando.

Los estantes de los archivos se extienden a lo largo de 53 millas por corredores tenuemente iluminados y están llenos de correspondencia papal que data del siglo VIII y está escrita por personajes como Mary Queen of Scots y Wolfgang Amadeus Mozart.

El único problema: hay muchos documentos. Más de 1,000 académicos ingresan anualmente para recorrer los estantes, pero aún hay mucho por leer, inventariar, digitalizar o traducir.

Es por eso que un profesor de tecnología en Roma, decidió que era hora de dejar que los algoritmos ingresaran en las sagradas salas del Vaticano, utilizando el software de inteligencia artificial que se enseña para leer el latín medieval.

“Cuando mencioné por primera vez mis ideas para entrenar una computadora para poder leer la escritura de escribanos de alrededor de 1,000 años del Vaticano, me dijeron que era imposible, pero eso solo me estimuló para hacerlo”, dijo Paolo Merialdo, un académico en Roma Tre University.

La posibilidad de encontrar nuevas ideas sobre la historia era demasiado difícil de resistir. Después de todo, fue en esos estantes en 1920, que los archivistas encontraron una carta con 81 sellos de cera adjuntos, enviados por nobles británicos al papa Clemente VII, en 1530, exigiendo permiso para que Enrique VIII se divorciara de Catalina de Aragón.

Otros tesoros incluyen una carta de María Antonieta de Francia justo antes de ir a la guillotina en 1793, y la nota de 1650 escrita en seda y doblada dentro de una varita de bambú en la que la emperatriz Wang dijo al Papa que se estaba convirtiendo al cristianismo.

De 1887, hay una carta de un nativo norteamericano, escrita en una corteza de árbol, que se dirige al Papa como el “Gran maestro de las oraciones”.

En 1810, Napoleón llevó los archivos a París después de ocupar Italia. Aproximadamente una cuarta parte de los documentos se perdieron, gran parte de los cuales fueron triturados y vendidos a una fábrica de cartón, pero el resto fue devuelto. Algunos documentos recuperados todavía tienen números de referencia franceses en ellos.

A pesar de los matices del “Código Da Vinci”, el “secreto” de los Archivos, en la vida real son como un bunker de acero de alta tecnología, pero como se expone en “Angels and Demons” de Dan Brown, hay secretos esperando a ser encontrados. Inclusive, Merialdo, de 53 años, que tiene un parecido a Tom Hanks, muestra una gran confianza en sí mismo al construir un equipo de investigación que ahora incluye al archivista del Vaticano, Marco Maiorino.

“Le dije a Merialdo que sería difícil para una computadora leer los documentos debido al latín antiguo y las abreviaturas utilizadas por los escribas”, dijo Maiorino. “Pero estaba intrigado porque hay mucho en esos materiales que nunca ha sido visto”.

“Y si un historiador ha leído una página, puede pasar por alto algo que un algoritmo atraparía”, agregó Merialdo.

Al dúo se unió la académica Donatella Firmani, de 34 años, quien explicó el desafío del equipo tomando una tarjeta de negocios y escaneando con su teléfono, produciendo un texto preciso en la pantalla.

“Es un software normal de reconocimiento óptico de caracteres”, dijo. “Pero ahora mira esto”. Al escanear una página de latín medieval, al teléfono se le ocurrieron algunas líneas con disparates y se dio por vencido.

Para poner en marcha su software, los miembros del equipo escanearon las cartas enviadas por el Papa Honorio III, del siglo XIII, y le enseñaron a la computadora a leerlas con la ayuda de 600 estudiantes italianos. A estos se les mostraron letras latinas medievales, escritas en los diferentes estilos utilizados por los escribas vaticanos, y se les pidió que las identificaran en las pantallas de las computadoras.

“Se llama ‘coincidencia de patrones'”, dijo Merialdo. “Los alumnos no necesitaban leer en latín, simplemente encontraban las letras, y al hacerlo repetidas veces, al escoger letras escritas de manera diferente, le enseñaban a la computadora cómo hacer el trabajo”.

El inconveniente fue la escritura combinada o cursiva, que confundió a la computadora en su lucha por descubrir dónde comienzan y terminan las letras, solo piense en la palabra inglesa “minimum” escrita a mano.

Sin inmutarse, el equipo le dio a la computadora un vocabulario latino para que pudiera acostumbrarse a combinaciones de letras comunes, para dividirlas mejor en letras.

“Tome la palabra latina Huiuscemodi, que significa ‘de este tipo.’ Las letras escritas a mano podrían aparecer como tres ‘I’, pero la computadora sabe que es imposible, o dos ‘uu’, que la computadora sabe que son raras”, dijo Merialdo. “Otro ejemplo es cómo la ‘s’ a menudo era muy similar a ‘f’, pero si la computadora ve la letra antes de una ‘c’, sabrá que tiene que ser ‘s'”.

También programaron la computadora para dibujar líneas verticales que separan cada trazo individual de la pluma.

“La computadora examina todas las posibles letras que se pueden generar a partir de los trazos y ofrece soluciones utilizando sus conocimientos.

Hasta ahora, la computadora tiene una tasa de precisión de lectura del 65%. “Más del 72% si permite palabras con una sola letra incorrecta, y todavía estamos entrenando para reconocer abreviaturas”, dijo Merialdo.

“Un ejemplo”, agregó Maiorino, “es la palabra ‘Epi’, que solía significar” Episcopi “, en latín significa” episcopal”.

A continuación, la computadora recibirá combinaciones de palabras comunes y un poco de gramática, lo que aumentará su inteligencia artificial. El equipo también descubrió que trazar líneas verticales era complicado cuando los trazos eran diagonales o cuando las letras se superponían.

“Enseñamos a la computadora a pintar cada trazo con diferentes colores como piezas de rompecabezas y los diferenciamos de esa manera”, dijo Merialdo.

El nombre de su programa de computadora es In Codice Ratio. “Es un juego de palabras”, explicó Merialdo. “Codice” es la forma en latín para nombrar a los documentos, pero también significa código de computadora en italiano, mientras que “ratio” significa razón en latín. “Significa que encontrarás ideas en los documentos y en el código”.

Para el 2019, el grupo espera desarrollar su programa para lograr una precisión del 95%, ya que sus miembros están cerca de sus metas. Aunque no traducirá el latín, generará versiones de documentos digitales más fáciles de leer.

El trabajo es una salida para Merialdo y Firmani, quienes están más acostumbrados a desarrollar algoritmos usados por Siri y Alexa, y construyen los llamados gráficos de conocimiento para ayudar a Google a responder las preguntas de los usuarios. “Todo comenzó cuando me di cuenta de que estaba estudiando internet, pero a la vuelta de la esquina, aquí en Roma, tenía el archivo más rico del mundo para estudiar”, dijo Merialdo.

La nueva pasión del equipo por desenredar el latín medieval ya está encontrando aplicaciones en el mundo moderno, lejos de las silenciosas salas de lectura del Vaticano. “Gracias a este trabajo tenemos un contrato con una compañía que usará el software para leer escaneos de recibos manuscritos arrugados, que podrían ser muy útiles para los contadores de impuestos”, dijo Merialdo.

Maiorino dijo que esperaba el día en que los documentos del Vaticano transcritos por el software le permitieran realizar búsquedas de palabras a lo largo de los siglos.

“El Vaticano puede ser el estado más pequeño del mundo, pero aún hoy tiene más embajadores en todo el mundo que cualquier otro país, excepto EE.UU., y tenemos registros de toda su correspondencia desde hace 12 siglos”, dijo.

Maiorino habla por experiencia. En 2012 participó en la preparación de una exhibición de los mayores tesoros de los archivos, incluida la bula papal de 1493, o el decreto que dividió el Nuevo Mundo entre España y Portugal después del regreso de Colón de las Américas, uno de los documentos más importantes en la historia del mundo.

“Hemos estado bromeando sobre cómo el programa robará mi trabajo”, dijo Maiorino, que es un experto en latín medieval. “Pero solo transcribirá textos, mientras yo continuaré traduciéndolos e interpretándolos”.

ENLACE: https://lat.ms/2ORwlb3



Categorías:CULTURA, REPORTAJES Y ESPECIALES

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

Conectando a %s

A %d blogueros les gusta esto: