¿Te imaginas un robot que pueda limpiar tu casa o rescatar personas? ¡Esto está más cerca de lo que piensas! Los ingenieros del MIT han desarrollado una metodología avanzada que permite a los robots tomar decisiones intuitivas para completar tareas específicas en un entorno determinado. Este enfoque innovador, llamado Clio, permite a los robots identificar y recordar únicamente los elementos de una escena que son relevantes para las tareas que se les asignan, todo esto utilizando el conocimiento del lenguaje natural.
Etiqueta: visión por computadora
Bill Gates apuesta por la visión por computadora para erradicar la malaria
Bill Gates no es solo el tipo que creó Microsoft y se convirtió en uno de los hombres más ricos del mundo. También es alguien profundamente comprometido con hacer del mundo un lugar mejor, y su último proyecto lo demuestra. Recientemente, Gates ha puesto en marcha una iniciativa que utiliza visión por computadora para combatir la malaria, una enfermedad que mata a más de 600,000 personas al año, principalmente en África subsahariana.
Continúa leyendo «Bill Gates apuesta por la visión por computadora para erradicar la malaria»
El surgimiento de la Inteligencia Artificial y la evolución de la visión
Hace 540 millones de años, la Tierra era un lugar muy diferente. El océano, aunque lleno de vida, estaba sumido en la oscuridad. No porque no hubiera luz, sino porque no existía la capacidad de ver. La luz del sol llegaba hasta el fondo del océano y los ventiladores hidrotermales iluminaban el lecho marino, pero no había ojos para captar esa luz. No existían retinas, ni córneas, ni lentes.
Continúa leyendo «El surgimiento de la Inteligencia Artificial y la evolución de la visión»
Un robot autónomo para eliminar malezas: Innovación en la agricultura
Las tecnologías robóticas están cambiando diversos sectores, y la agricultura es uno de los que más me interesan. Imagínate un robot que pueda recorrer campos de pastoreo y eliminar malezas invasoras sin necesidad de pesticidas. Suena increíble, ¿verdad? Pues bien, investigadores del VVT Technical Research Centre de Finlandia han desarrollado precisamente eso: un robot que puede remover malezas de manera autónoma.
Continúa leyendo «Un robot autónomo para eliminar malezas: Innovación en la agricultura»
Meta apuesta por el futuro con Chameleon, su revolucionario modelo multimodal
Otro paso se ha dado en el mundo de la inteligencia artificial, Meta ha lanzado Chameleon, su modelo multimodal de vanguardia. A diferencia de los enfoques convencionales, este sistema innovador se basa en una arquitectura de fusión temprana, lo que le permite combinar diferentes tipos de datos desde el principio del proceso (como GPT 4o).
En lugar de procesar las entradas por separado y luego unirlas más adelante, Chameleon entrelaza las asociaciones desde el inicio. Esto se logra convirtiendo imágenes, texto y código en tokens discretos que comparten un vocabulario unificado. De este modo, el modelo puede razonar y generar contenido mezclado de manera más fluida y natural.
Continúa leyendo «Meta apuesta por el futuro con Chameleon, su revolucionario modelo multimodal»
MELON, la forma que tiene Google de reconstruir en 3D a partir de imágenes 2D
Y si ayer os hablé de VLOGGER, hoy os hablo de MELON, otro proyecto que llega desde Google Research con el objetivo de recrear objetos tridimensionales a partir de fotografías bidimensionales.
No se trata de una tarea sencilla, sobre todo cuando las posiciones desde las que se tomaron las imágenes no son conocidas, por lo que la parte técnica del proyecto es realmente amplia y compleja.
Continúa leyendo «MELON, la forma que tiene Google de reconstruir en 3D a partir de imágenes 2D»
Esta tecnología permite detectar objetos como ninguna otra, así es YOLO v9
Hace tiempo que sigo la evolución en el campo de la visión por computadora. En particular, la serie de modelos YOLO (You Only Look Once) siempre ha capturado mi atención por su capacidad para procesar imágenes rápidamente, detectando objetos con precisión. La última iteración, YOLO v9, desarrollada por Ultralytics, no es la excepción y marca un hito importante en esta trayectoria.
Continúa leyendo «Esta tecnología permite detectar objetos como ninguna otra, así es YOLO v9»
Una impresora 3D con «ojos y cerebro», para mejorar su precisión
En un reciente avance tecnológico, investigadores del MIT, junto con la empresa Inkbit y la ETH Zurich, han presentado una impresora 3D que redefine los límites de la fabricación aditiva. Este desarrollo, que integra la visión por computadora en el proceso de impresión 3D, representa un salto cualitativo en términos de precisión y versatilidad de materiales.
Continúa leyendo «Una impresora 3D con «ojos y cerebro», para mejorar su precisión»
DeepMind RT-2, el modelo inteligente que traduce visión y lenguaje en acciones
En un paso adelante hacia una comunicación más fluida entre seres humanos y máquinas, DeepMind ha presentado su modelo RT-2. Este nuevo sistema permite el control de robots a través de instrucciones en lenguaje natural y visionado de imágenes, combinando textos, imágenes y coordenadas en un solo modelo. A continuación, se presenta un análisis profundo de esta tecnología y su potencial en la industria robótica. Continúa leyendo «DeepMind RT-2, el modelo inteligente que traduce visión y lenguaje en acciones»
Cómo la inteligencia artificial «ve» las imágenes y por qué a veces se confunde
Un nuevo estudio revela cómo los sistemas de inteligencia artificial (IA) procesan las imágenes y por qué a veces cometen errores sorprendentes, como clasificar una imagen de un astronauta como una pala. Continúa leyendo «Cómo la inteligencia artificial «ve» las imágenes y por qué a veces se confunde»