Cuando pensamos en inteligencia artificial y lenguaje, lo primero que nos viene a la mente es texto plano, líneas de palabras que una máquina debe leer y procesar. Pero, ¿y si esa no fuera la manera más eficiente de hacerlo? Esa es la premisa detras de DeepSeek-OCR, un modelo de código abierto desarrollado por la firma china DeepSeek que ha desafiado los cánones tradicionales del procesamiento de lenguaje natural.
En lugar de leer texto como secuencias lineales de tokens, DeepSeek-OCR convierte el texto en imágenes y lo procesa visualmente. Esta estrategia, llamada «compresión óptica de contexto», permite reducir la cantidad de datos que una IA necesita para entender documentos extensos. La idea central es que, al ver el texto como una imagen, se puede comprimir su contenido hasta diez veces, sin perder información crucial. Continúa leyendo «DeepSeek-OCR: una nueva forma de comprimir texto a través de imágenes»