DeepMind RT-2, el modelo inteligente que traduce visión y lenguaje en acciones

En un paso adelante hacia una comunicación más fluida entre seres humanos y máquinas, DeepMind ha presentado su modelo RT-2. Este nuevo sistema permite el control de robots a través de instrucciones en lenguaje natural y visionado de imágenes, combinando textos, imágenes y coordenadas en un solo modelo. A continuación, se presenta un análisis profundo de esta tecnología y su potencial en la industria robótica. Continúa leyendo «DeepMind RT-2, el modelo inteligente que traduce visión y lenguaje en acciones»