MELON, la forma que tiene Google de reconstruir en 3D a partir de imágenes 2D

Y si ayer os hablé de VLOGGER, hoy os hablo de MELON, otro proyecto que llega desde Google Research con el objetivo de recrear objetos tridimensionales a partir de fotografías bidimensionales.

No se trata de una tarea sencilla, sobre todo cuando las posiciones desde las que se tomaron las imágenes no son conocidas, por lo que la parte técnica del proyecto es realmente amplia y compleja.

Continúa leyendo «MELON, la forma que tiene Google de reconstruir en 3D a partir de imágenes 2D»

Publicado en

Esta tecnología permite detectar objetos como ninguna otra, así es YOLO v9

Hace tiempo que sigo la evolución en el campo de la visión por computadora. En particular, la serie de modelos YOLO (You Only Look Once) siempre ha capturado mi atención por su capacidad para procesar imágenes rápidamente, detectando objetos con precisión. La última iteración, YOLO v9, desarrollada por Ultralytics, no es la excepción y marca un hito importante en esta trayectoria.

Continúa leyendo «Esta tecnología permite detectar objetos como ninguna otra, así es YOLO v9»

Una impresora 3D con «ojos y cerebro», para mejorar su precisión

En un reciente avance tecnológico, investigadores del MIT, junto con la empresa Inkbit y la ETH Zurich, han presentado una impresora 3D que redefine los límites de la fabricación aditiva. Este desarrollo, que integra la visión por computadora en el proceso de impresión 3D, representa un salto cualitativo en términos de precisión y versatilidad de materiales.

Continúa leyendo «Una impresora 3D con «ojos y cerebro», para mejorar su precisión»

DeepMind RT-2, el modelo inteligente que traduce visión y lenguaje en acciones

En un paso adelante hacia una comunicación más fluida entre seres humanos y máquinas, DeepMind ha presentado su modelo RT-2. Este nuevo sistema permite el control de robots a través de instrucciones en lenguaje natural y visionado de imágenes, combinando textos, imágenes y coordenadas en un solo modelo. A continuación, se presenta un análisis profundo de esta tecnología y su potencial en la industria robótica. Continúa leyendo «DeepMind RT-2, el modelo inteligente que traduce visión y lenguaje en acciones»

MAGE: La fusión de reconocimiento y generación de imágenes en un solo sistema

La visión por computadora ha dado un gran salto gracias a la creación de un sistema revolucionario llamado MAGE. Desarrollado por investigadores del Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT (CSAIL) y Google, MAGE fusiona dos tareas clave: el reconocimiento y la generación de imágenes. Este enfoque innovador supera la separación histórica entre estas funciones y logra un sistema único capaz de identificar imágenes con precisión y crear nuevas imágenes con una sorprendente semejanza a la realidad. Continúa leyendo «MAGE: La fusión de reconocimiento y generación de imágenes en un solo sistema»

Método de IA para generar escenas a partir de imágenes

Un equipo de investigadores de la Universidad de Twente, encabezado por Michael Ying Yang, ha desarrollado un método innovador que permite crear representaciones visuales completas a partir de imágenes. Este avance en Inteligencia Artificial (IA) tiene el potencial de generar imágenes realistas y coherentes al mismo tiempo que mejora la capacidad de las computadoras para detectar y comprender las relaciones visuales entre objetos. El estudio, publicado recientemente en la revista IEEE Transactions on Pattern Analysis and Machine Intelligence, muestra cómo este nuevo enfoque podría tener aplicaciones no solo en la generación de imágenes, sino también en la percepción de vehículos autónomos y robots. Continúa leyendo «Método de IA para generar escenas a partir de imágenes»

La increíble tecnología que nos permite ver más allá de las paredes

Hoy les traigo una noticia fascinante que está revolucionando nuestra forma de ver el mundo. Se trata de una nueva técnica desarrollada por investigadores del MIT y la Universidad de Rice que nos permite ver a través de objetos brillantes y descubrir perspectivas ocultas que antes estaban fuera de nuestro alcance. ¿Quieres saber más sobre esta increíble innovación? ¡Sigue leyendo! Continúa leyendo «La increíble tecnología que nos permite ver más allá de las paredes»

Nueva tecnología de Meta para la detección de objetos en imágenes y videos

Meta, la gigante de las redes sociales, ha presentado una nueva tecnología llamada «Segment Anything» que permite a los sistemas de inteligencia artificial detectar objetos en imágenes y videos sin necesidad de entrenamiento previo. Esta innovación marca un hito en el campo de la visión por computadora y ofrece nuevas oportunidades para aplicaciones prácticas en diversos campos. Continúa leyendo «Nueva tecnología de Meta para la detección de objetos en imágenes y videos»

Google Brain: la revolución del aprendizaje automático

Desde su creación en 2011, Google Brain ha sido un proyecto clave en el desarrollo del aprendizaje automático y la inteligencia artificial (IA). Esta iniciativa, liderada por Andrew Ng, Jeff Dean y Greg Corrado, ha impulsado el avance en áreas como el procesamiento del lenguaje natural, la visión por computadora y la traducción automática. Continúa leyendo «Google Brain: la revolución del aprendizaje automático»