Una inteligencia artificial que “juzga un libro por su portada”

Visualización red neuronal


Una visualización del esquema de procesamiento | Brian Kenji Iwana y Seiichi Uchida (Arxive.org)

La típica frase de “nunca juzgues un libro por su portada” no planea ser enseñada a los computadores, o al menos esto es lo que se extrae del trabajo de un par de investigadores de la Universidad de Kyushu en Fukuoka, Japón, quienes han empezado a utilizar las redes neuronales para ver si un ente artificial puede detectar correctamente el género de un libro con solo ver su portada.

Claro, el potencial es variado, empezando por el poder diseñar mejores portadas que puedan promocionar de una forma más acorde los contenidos de un libro permitiendo inferir la categoría a la que pertenece, sugerir géneros óptimos para etiquetarlos o seguir aportando a campos de visión artificial. Eso sí, son enormes los retos, empezando por la variedad de portadas y de temáticas que cubren los libros.

En fin, yendo un poco a los detalles, la materia prima ha sido 137788 cubiertas únicas tomadas de Amazon.com y sus respectivos géneros literarios de entre 20 posibles -con un ligero ajuste para aquellos títulos clasificados en varios géneros-. Del siguiente paso se ha encargado la red neuronal, del tipo convolucional, que intentó atrapar la correlación entre géneros y cubiertas.

En cuanto a los resultados iniciales, en el 40% de las ocasiones se estimó uno de los tres géneros principales entre los que se clasificaban originalmente, un 20% de ocasiones atinándole al primer género listado. No es perfecto el procedimiento pero es bastante bueno si se considera lo complicado que puede ser enseñar a diferenciar por portadas entre un libro para niños y un cómic, o uno de Historia frente a uno de biografías, libros de Medicina con los de otras Ciencias, etc.

En todo caso se enriquece este campo pensando en un futuro poder hasta enseñar a una máquina a diseñar la portada de un libro, aunque, como destacan en MIT Technology Review donde reseñan el paper de la investigación, quedan retos para un futuro más cercano como el comparar la eficiencia de la red de clasificación enfrentándola en pruebas a la categorización realizada por grupos de humanos.

Más información: Judging a Book By its Cover (PDF)

Juan David Quiñónez

Estadístico. Amante de las nuevas tecnologías, la ciencia, el mundo académico y las aplicaciones de las anteriores temáticas en la red. Escribe en wwwhatsnew.com desde finales del 2011.