Etiqueta: visión por computadora

Una nueva forma de ver el mundo: reconstrucciones 3D ultrarrápidas a partir de fotos 2D

Publicado el 8 agosto, 2025

Reconstruir la realidad usando fotografías puede sonar a magia, pero es algo que la tecnología lleva años intentando perfeccionar. El reto es enorme: a partir de simples imágenes bidimensionales, los ordenadores deben deducir formas, distancias y proporciones para crear un modelo tridimensional del entorno. Es como si alguien intentara recrear una ciudad entera viendo solo postales desde distintos ángulos, sin saber desde dónde ni a qué distancia fueron tomadas. Continúa leyendo «Una nueva forma de ver el mundo: reconstrucciones 3D ultrarrápidas a partir de fotos 2D»

Google da un salto en la comprensión visual con Gemini 2.5: así funciona la segmentación conversacional de imágenes

Publicado el 28 julio, 2025

por Natalia Polo

Google ha presentado una mejora significativa en su modelo de inteligencia artificial Gemini 2.5, incorporando una capacidad conocida como segmentación conversacional de imágenes. Este avance permite que el sistema identifique partes específicas de una imagen mediante preguntas formuladas en lenguaje natural, abriendo nuevas posibilidades tanto para usuarios comunes como para industrias especializadas. Continúa leyendo «Google da un salto en la comprensión visual con Gemini 2.5: así funciona la segmentación conversacional de imágenes»

Un revolucionario avance en robótica: clio permitirá a los robots limpiar tu casa y realizar rescates eficientemente

Publicado el 5 octubre, 2024

por Laura González Marín

¿Te imaginas un robot que pueda limpiar tu casa o rescatar personas? ¡Esto está más cerca de lo que piensas! Los ingenieros del MIT han desarrollado una metodología avanzada que permite a los robots tomar decisiones intuitivas para completar tareas específicas en un entorno determinado. Este enfoque innovador, llamado Clio, permite a los robots identificar y recordar únicamente los elementos de una escena que son relevantes para las tareas que se les asignan, todo esto utilizando el conocimiento del lenguaje natural.

Continúa leyendo «Un revolucionario avance en robótica: clio permitirá a los robots limpiar tu casa y realizar rescates eficientemente»

Bill Gates apuesta por la visión por computadora para erradicar la malaria

Publicado el 24 agosto, 2024

por Juan Diego Polo

Bill Gates no es solo el tipo que creó Microsoft y se convirtió en uno de los hombres más ricos del mundo. También es alguien profundamente comprometido con hacer del mundo un lugar mejor, y su último proyecto lo demuestra. Recientemente, Gates ha puesto en marcha una iniciativa que utiliza visión por computadora para combatir la malaria, una enfermedad que mata a más de 600,000 personas al año, principalmente en África subsahariana.

Continúa leyendo «Bill Gates apuesta por la visión por computadora para erradicar la malaria»

El surgimiento de la Inteligencia Artificial y la evolución de la visión

Publicado el 6 julio, 2024

por Juan Diego Polo

Hace 540 millones de años, la Tierra era un lugar muy diferente. El océano, aunque lleno de vida, estaba sumido en la oscuridad. No porque no hubiera luz, sino porque no existía la capacidad de ver. La luz del sol llegaba hasta el fondo del océano y los ventiladores hidrotermales iluminaban el lecho marino, pero no había ojos para captar esa luz. No existían retinas, ni córneas, ni lentes.

Continúa leyendo «El surgimiento de la Inteligencia Artificial y la evolución de la visión»

Un robot autónomo para eliminar malezas: Innovación en la agricultura

Publicado el 13 junio, 2024

por Juan Diego Polo

Las tecnologías robóticas están cambiando diversos sectores, y la agricultura es uno de los que más me interesan. Imagínate un robot que pueda recorrer campos de pastoreo y eliminar malezas invasoras sin necesidad de pesticidas. Suena increíble, ¿verdad? Pues bien, investigadores del VVT Technical Research Centre de Finlandia han desarrollado precisamente eso: un robot que puede remover malezas de manera autónoma.

Continúa leyendo «Un robot autónomo para eliminar malezas: Innovación en la agricultura»

Meta apuesta por el futuro con Chameleon, su revolucionario modelo multimodal

Publicado el 23 mayo, 2024

por Juan Diego Polo

Otro paso se ha dado en el mundo de la inteligencia artificial, Meta ha lanzado Chameleon, su modelo multimodal de vanguardia. A diferencia de los enfoques convencionales, este sistema innovador se basa en una arquitectura de fusión temprana, lo que le permite combinar diferentes tipos de datos desde el principio del proceso (como GPT 4o).

En lugar de procesar las entradas por separado y luego unirlas más adelante, Chameleon entrelaza las asociaciones desde el inicio. Esto se logra convirtiendo imágenes, texto y código en tokens discretos que comparten un vocabulario unificado. De este modo, el modelo puede razonar y generar contenido mezclado de manera más fluida y natural.

Continúa leyendo «Meta apuesta por el futuro con Chameleon, su revolucionario modelo multimodal»

MELON, la forma que tiene Google de reconstruir en 3D a partir de imágenes 2D

Publicado el 20 marzo, 2024

por Juan Diego Polo

Y si ayer os hablé de VLOGGER, hoy os hablo de MELON, otro proyecto que llega desde Google Research con el objetivo de recrear objetos tridimensionales a partir de fotografías bidimensionales.

No se trata de una tarea sencilla, sobre todo cuando las posiciones desde las que se tomaron las imágenes no son conocidas, por lo que la parte técnica del proyecto es realmente amplia y compleja.

Continúa leyendo «MELON, la forma que tiene Google de reconstruir en 3D a partir de imágenes 2D»

Esta tecnología permite detectar objetos como ninguna otra, así es YOLO v9

Publicado el 24 febrero, 2024

por Juan Diego Polo

Hace tiempo que sigo la evolución en el campo de la visión por computadora. En particular, la serie de modelos YOLO (You Only Look Once) siempre ha capturado mi atención por su capacidad para procesar imágenes rápidamente, detectando objetos con precisión. La última iteración, YOLO v9, desarrollada por Ultralytics, no es la excepción y marca un hito importante en esta trayectoria.

Continúa leyendo «Esta tecnología permite detectar objetos como ninguna otra, así es YOLO v9»

Una impresora 3D con «ojos y cerebro», para mejorar su precisión

Publicado el 17 noviembre, 2023

por Juan Diego Polo

En un reciente avance tecnológico, investigadores del MIT, junto con la empresa Inkbit y la ETH Zurich, han presentado una impresora 3D que redefine los límites de la fabricación aditiva. Este desarrollo, que integra la visión por computadora en el proceso de impresión 3D, representa un salto cualitativo en términos de precisión y versatilidad de materiales.

Continúa leyendo «Una impresora 3D con «ojos y cerebro», para mejorar su precisión»