Basándose en la mecánica del cerebro humano y su capacidad para distinguir entre diferentes partes de una imagen, un equipo de investigadores señalan que el nuevo sistema representa con mayor precisión la visión humana que cualquier otro anterior.
Este sistema de inteligencia artificial (IA) de vanguardia, puede predecir con precisión las áreas de una imagen donde es más probable que mire una persona. Entre otras posibilidades, esta tecnología podría utilizarse para la detección de tumores en imágenes médicas.
Una “visión artificial” que busca eficientemente cosas
Poder centrar nuestra atención es una parte importante del sistema visual humano, que nos otorga la capacidad de seleccionar e interpretar la información más relevante en una escena puntual.
A lo largo del globo, científicos han estado aplicando distintos sistemas informáticos en sus estudios, para tratar de recrear esta capacidad de seleccionar las partes más destacadas de una imagen, con un desigual éxito entre intento e intento.
En esta investigación, un equipo de la Universidad de Cardiff utilizó un algoritmo informático de aprendizaje profundo, conocido como red neuronal convolucional, que está diseñado para imitar la red interconectada de neuronas en el cerebro humano y está modelado específicamente en la corteza visual.
Por su modo de trabajo, este tipo de algoritmo es ideal para tomar imágenes como base de un análisis y poder asignar importancia a varios objetos o aspectos dentro de la propia imagen.
El Grupo de Investigación de Informática Multimedia de la citada casa de estudios del Reino Unido, ahora trabaja para probar el sistema ayudando a los radiólogos a encontrar lesiones en las imágenes médicas, con el objetivo general de mejorar la velocidad, la precisión y la sensibilidad de los diagnósticos médicos.
Además del principal potencial uso que se destaca, otras posibles aplicaciones del nuevo sistema van desde la robótica, la comunicación multimedia y la videovigilancia, hasta la edición automatizada de imágenes.
En su estudio, el equipo trabajó con una enorme base de datos de imágenes, en la que cada imagen ya había sido analizada o simplemente vista por humanos, para identificar «áreas de interés» en ellas, utilizando un software de seguimiento ocular.
Posteriormente, estas imágenes se incorporaron al algoritmo y, mediante la utilización de IA de aprendizaje profundo, el sistema comenzó a aprender lentamente detalles sobre las imágenes, hasta adquirir la capacidad de predecir con precisión cuáles serían las partes más destacadas de la imagen.
Este nuevo sistema fue puesto a prueba frente a otros siete sistemas que apuntan al mismo fin, todos de última generación y que ya están en uso. El nuevo sistema demostró ser superior en todas las métricas de análisis.
El Dr. Hantao Liu, de la Facultad de Ciencias de la Computación e Informática de la Universidad de Cardiff, destacó que esta IA es “capaz de predecir con éxito dónde miran las personas en imágenes naturales podría desbloquear una amplia gama de aplicaciones, desde la detección automática de objetivos hasta la robótica, el procesamiento de imágenes y el diagnóstico médico”.
Mientras el equipo tras el desarrollo de este sistema ya planea trabajar con radiólogos, para determinar cómo se materializaría su ayuda en la detección de lesiones en imágenes médicas; también pusieron a disposición gratuitamente su código, “para que todos puedan beneficiarse de la investigación y encontrar nuevas formas de aplicar esta tecnología a problemas y aplicaciones del mundo real”, en palabras de Liu.