En lugar de hacerlo todo sola, la inteligencia artificial (IA) está empezando a mirar el mundo con ojos más parecidos a los nuestros, y el primer paso ha sido un simple pero ingenioso juego online: Click Me. Detrás de esta propuesta está un grupo de investigadores de la Universidad de Brown, que ha unido fuerzas de la psicología, la neurociencia y el aprendizaje automático para dar forma a una nueva generación de IA más cercana a la percepción humana.
Un juego que entrena modelos de IA
Click Me es una plataforma interactiva en la que los usuarios participan simplemente haciendo clic en las partes más relevantes de una imagen, aquellas que consideran esenciales para que una IA entienda qué está viendo. El sistema solo puede ver las zonas que han sido clicadas, por lo que los jugadores deben pensar de forma estratégica: no se trata de hacer clic al azar, sino de señalar qué fragmentos realmente aportan información visual clave.
Este mecanismo, aparentemente simple, proporciona datos fundamentales sobre cómo los humanos procesamos lo visual. A través de millones de interacciones recogidas en la plataforma, los investigadores recopilan patrones de atención humana para que la IA los tome como referencia.
El problema de la IA que «ve» distinto a los humanos
Durante los últimos años, los sistemas de reconocimiento de imágenes por IA han mejorado considerablemente. Son capaces de identificar animales, objetos o incluso enfermedades en una radiografía. Pero estos modelos cometen errores que los humanos raramente harían. Por ejemplo, pueden confundir un perro con gafas por otra especie o no identificar una señal de tráfico si está parcialmente cubierta de grafitis.
Cuanto más complejos se vuelven los modelos, más frecuentes son este tipo de fallos. Esto revela que su manera de analizar las imágenes no se corresponde con la forma en que lo hacemos las personas.
Alineación entre percepción humana e inteligencia artificial
Aquí es donde entra en juego la llamada armonización neuronal. Tras recopilar los datos del juego, los investigadores entrenan a los modelos de IA obligándolos a enfocarse exclusivamente en las partes de la imagen que los humanos han indicado como relevantes. Es una forma de enseñarles qué mirar, para que su proceso de reconocimiento visual imite el humano.
Esta técnica permite reducir significativamente los errores que los modelos cometen y mejora su interpretabilidad. Es como enseñarle a un niño a observar primero los ojos y el hocico para reconocer a un gato, en lugar de dejar que lo descubra solo tras miles de intentos erróneos.
Participación masiva para una IA más humana
El proyecto ha logrado algo que muchas investigaciones no consiguen: implicar al público general. Miles de personas han jugado a Click Me, compartiendo el proyecto en redes como Instagram o Reddit. Esta participación ciudadana ha generado decenas de millones de clics que alimentan el modelo y aceleran su aprendizaje.
Este enfoque colaborativo no solo es eficaz, sino también valioso desde el punto de vista ético y social. Involucrar a la sociedad en el desarrollo de estas tecnologías crea confianza y permite que los resultados se alineen con nuestras necesidades reales.
IA que piensa como nosotros: aplicaciones concretas
Uno de los puntos más interesantes de este trabajo es su aplicación directa en escenarios reales. En el sector de la salud, por ejemplo, es esencial que los médicos puedan comprender por qué una IA ha llegado a cierto diagnóstico. Si la máquina basa sus decisiones en las mismas señales visuales que un humano, su uso se vuelve mucho más fiable.
En el caso de los vehículos autónomos, un sistema visual más cercano al humano puede anticipar mejor el comportamiento de peatones y otros conductores. De este modo, se reducen los riesgos en la conducción automatizada.
También hay ventajas en campos como la educación, la accesibilidad digital o el soporte a la toma de decisiones. En todos estos ámbitos, contar con una IA que percibe e interpreta como lo haría una persona facilita su integración y aceptación.
Repensar la IA desde la ciencia cognitiva
La aportación de esta investigación va más allá del desarrollo tecnológico. Al imitar nuestra visión, los modelos de IA se convierten también en herramientas para estudiar cómo funciona nuestro propio cerebro. Esto abre nuevas vías para la neurociencia computacional y para comprender mejor los procesos que usamos, sin darnos cuenta, al reconocer patrones visuales.
Todo este trabajo ha sido posible gracias al apoyo de la Fundación Nacional de Ciencias (NSF), que ha financiado esta iniciativa como parte de su apuesta por la investigación básica con impacto social.
