Una imagen vale más que mil palabras, dice el refrán. Cierto es que los seres humanos somos visuales: utilizamos las imágenes desde tiempos inmemoriales como modo de aprendizaje y forma de comunicación. Y aun así, los principales buscadores utilizan la semántica como principal motor de búsqueda, obligándonos a transformar en palabras pensamientos que generamos en forma visual.
En determinados campos como el de la moda, la búsqueda por palabras ha demostrado ser inefectiva por su alto componente de subjetividad: existen tantas descripciones como percepciones. Es ahí donde entran en juego los buscadores visuales como el que han desarrollado en Wide Eyes: un motor de búsqueda, objetivo y eficiente, en el que una imagen vale una imagen. Encontrar y comprar a partir de una imagen es una realidad factible gracias a su tecnología de visión por computación: permite encontrar cualquier tipo de prenda a partir de una foto o captura, y ofrecer artículos visualmente similares a los buscados. El reto consiste en aportar soluciones tecnológicas que den paso a una experiencia de compra innovadora, más efectiva y natural, rompiendo las barreras entre el mundo offline y online.
En su charla, Rodolfo Guichón, ha explicado que convertir la investigación de más alto nivel en servicios basados en APIs no consiste solo en “productificar” algoritmos escritos en un paper o pasar modelos desarrollados en simuladores matemáticos a lenguajes aptos para entornos de producción, sino en acompañar activamente el desarrollo, desde la concepción de la idea hasta el mantenimiento de las APIs, cuando estas ya están en producción. Esta metodología es una adaptación de la “Ingeniería de Requerimientos” de Pressman con sus siete fases (Inception, Elicitation, Elaboration, Negotiation, Specification, Validation y Management) adaptada a Agile Development y un entorno de investigación colaborativo.
El resultado final es un producto que cumple tanto con los requerimientos funcionales como cualitativos especificados. Las APIs crean una capa de abstracción de la complejidad inherente a los algoritmos de visión por computador e inteligencia artificial de tal manera que usuarios no expertos en este tipo de tecnología puedan integrar nuestras soluciones con una curva de aprendizaje inexistente.