Miles de coches fotografiando las calles de varias ciudades de todo el mundo, borrando rostros y matrículas y capturando los números de las casas para poder aumentar la exactitud de la localización dentro de sus mapas, eso es lo que hay por detrás de Google Street View, pero… ¿cómo es capaz de reconocer los números de las casas?, ¿qué tecnología usa para poder saber que un 52 escrito a mano con tiza es, efectivamente, un 52?.
Imagen: números de casas de shutterstock.com
Seguramente muchos de vosotros ya habréis notado que los captcha que Google utiliza permite a los usuarios identificar el número mostrado en una puerta. En la imagen tenéis varios ejemplos. Ese es uno de los sistemas existentes que puede ayudar a definir un número borroso o mal escrito, pero no se deja todo en las manos de los usuarios, hay una enorme red de ordenadores dedicados a ese tema.
Así lo explican en el documento Multi-digit Number Recognition from Street View Imagery using Deep Convolutional Neural Networks (PDF), donde explican cómo usan una compleja Red neuronal artificial (sistema de inteligencia artificial inspirado en la forma en que funciona el sistema nervioso de los animales) para poder determinar los números de todas las casas capturadas en Francia, por ejemplo, en menos de una hora, según comentan en gizmodo.
Comentan en el estudio, publicado por Google:
Nuestras evaluaciones indican que el rendimiento del sistema propuesto es comparable al de los operadores humanos. Hasta la fecha, nuestro sistema ha ayudado a extraer cerca de 100 millones de números de calles capturados en Google Street View en todo el mundo.
En el documento hay detalles técnicos comentando el sistema utilizado. Aunque pueda parecer simple en un principio, la imagen que veis abajo muestra que el problema puede ser más complicado de lo que aparenta: