Esta IA puede crear imágenes de comidas leyendo una receta

Investigadores de la Universidad de Tel Aviv,  desarrollaron una IA que puede crear imágenes de comidas, a partir de los ingredientes de una receta.

Los creadores de esta red neuronal implementaron un sistema que le permite recrear el resultado final de una receta, generando una imagen de una comida ficticia.

IA - Universidad de Tel Aviv

Una tarea compleja, como describen en el documento que han compartido:

presentamos la nueva tarea de generar imágenes a partir de texto largo que no describe directamente el contenido visual de la imagen. Para esto, construimos un sistema para generar imágenes de alta resolución de 256 × 256 de alimentos condicionados a sus recetas.

Continúa leyendo «Esta IA puede crear imágenes de comidas leyendo una receta»

Twitter usa redes neuronales para mostrar la parte más interesante de las fotos

Twitter

De un tiempo a esta parte Twitter está apostando por la inclusión de diferentes mejoras. Recientemente hací­an oficial la ampliación en el lí­mite de caracteres por tweet, y hace tan solo unos dí­as os anunciábamos que ha empezado a permitir incluir descripciones en las imágenes para personas con problemas de visión. De ahora en adelante, Twitter nos mostrará la parte más interesante de las imágenes en la vista previa de las mismas gracias al potencial de las redes neuronales.

Tal y como explican los ingenieros responsables del desarrollo de esta función, inicialmente la caracterí­stica funcionaba a partir de un software básico de reconocimiento facial. Aunque el resultado era óptimo en fotografí­as de personas, el comportamiento no era el más adecuado con fotos de objetos, paisajes o animales. Comenzaron entonces a usar técnicas de seguimiento de ojos cuya información podí­an utilizar para entrenar a las redes neuronales y así­ predecir el punto más probable al que mirará una persona en una foto cualquiera.

Continúa leyendo «Twitter usa redes neuronales para mostrar la parte más interesante de las fotos»

Red neuronal de equipo de Google trabajando en detección de imágenes

reconocimiento de objetos en imágenes

ImageNet es una plataforma online que tiene como objetivo convertirse en un recurso útil para investigadores, educadores, estudiantes y todos aquellos que comparten su pasión por la imagen, sirviendo de bases de datos de la imagen organizada bajo la jerarquí­a WordNet. Desde 2010 viene organizando su concurso a modo de desafí­o para poner a prueba la tecnologí­a en lo que respecta a la detección e interpretación de las imágenes, tanto en lo que respecta a los objetos que las componen como en las zonas en las que se encuentran.

A dicho concurso de presentan instituciones académicas lí­deres y laboratorios de la industria, tal y como señala Christian Szegedy, Ingeniero de Software de Google, a través de Research Blog, en el que señala que su equipo, GoogLeNet, ha quedado en primer lugar en las tareas de clasificación y detección del desafí­o de este año, doblando la calidad de ambas tareas con respecto a los resultados del pasado año. La presentación de su equipo ha sido abierta, de modo que los detalles exactos del desafí­o han sido compartidos con el resto de usuarios que conforman la amplia comunidad enfocada a la visión por ordenador, fomentando la colaboración y acelerando el progreso en este campo.

El desafio de ImageNet consta de tres pistas: la clasificación, para medir la capacidad de los algoritmos a la hora de asignar las etiquetas adecuadas a una imagen; la clasificación con localización, que evalúa cómo un modelo de algoritmo ha llevado las etiquetas a una imagen y la localización de los objetos subyacentes; y la detección, similar a la anterior pero utiliza criterios de evaluación más estrictos. Se añade la dificultad del uso de imágenes en las que se encuentran pequeños objetos de difí­cil reconocimiento, lo que hace del desafí­o aún más interesante, yendo más allá del etiquetado de las imágenes.

Christian Szegedy continúa señalando a su propio equipo participante por el esfuerzo realizado y comenta como lo han llevado a cabo mediante el uso de la infraestructura DistBelief para hacer posible la formación de redes neuronales de una manera distribuida y de fácil interacción.