La Universidad de Washington estuvo trabajando en un proyecto que muestra la importancia del contenido visual en los estudios bibliométricos. Según su informe, se han dejado de lado porque son difíciles de analizar, pero con el potencial del Aprendizaje Automático se abren las puertas a nuevas herramientas que permiten este tipo de investigación.
Para que la dinámica de esta propuesta funcione, han utilizado visión por computador para extraer elementos visuales de millones de documentos científicos, para analizarlos y clasificarlos. Es un proceso complejo que se explica detalladamente en este informe, y que permite reconocer cinco tipos de contenidos, como por ejemplo gráficos, fotografías,tablas, entre otros.
Han analizado qué tipos de elementos visuales son más utilizados, teniendo en cuenta diferentes criterios, y el papel que juegan en el desarrollo de ideas complejas. Si bien han partido analizando 8 millones de imágenes de documentos de investigación biomédica tomados de PubMed, piensan extenderse a otras disciplinas.
Podemos probar el potencial de este proyecto en VizioMetrix. Solo tenemos que introducir un término científico y el buscador nos arrojará diferentes resultados según los criterios que hayamos seleccionados.
Cada una de las imágenes viene acompañada de un resumen, el enlace al documento correspondiente, así como la opción de ver imágenes relacionadas.