MindJourney: una nueva forma de enseñar a la IA a entender el espacio en 3D

Uno de los mayores desafíos de los modelos de lenguaje y visión (VLMs, por sus siglas en inglés) es que, aunque pueden identificar objetos y describir escenas en imágenes estáticas con una precisión notable, tienen serias limitaciones para interpretar espacios tridimensionales. En la práctica, esto significa que si se les presenta una pregunta que requiere entender la relación espacial entre objetos más allá de lo que una imagen 2D muestra directamente, fallan. Continúa leyendo «MindJourney: una nueva forma de enseñar a la IA a entender el espacio en 3D»

Cohere lanza modelos de IA Aya Vision: avances en la comprensión de imágenes y texto

La inteligencia artificial sigue evolucionando a pasos agigantados, y uno de los últimos avances en el campo de la visión computacional proviene de Cohere. La empresa ha lanzado Aya Vision, un conjunto de modelos de inteligencia artificial diseñados para analizar, traducir y generar texto basado en imágenes. Este lanzamiento es especialmente relevante porque los modelos son de código abierto, lo que significa que investigadores y desarrolladores pueden acceder a ellos libremente para proyectos académicos y experimentación.

Continúa leyendo «Cohere lanza modelos de IA Aya Vision: avances en la comprensión de imágenes y texto»