Mistral OCR 4: extracción documental estructurada en contenedor único, 170 idiomas y 4 dólares por millar de páginas

Mistral AI lanzó el 23 de junio de 2026 su cuarta generación de modelo de reconocimiento óptico de caracteres, y la novedad más relevante no es la precisión: es que OCR 4 deja de ser un OCR en el sentido clásico para convertirse en una herramienta de inteligencia documental estructurada. Lo cuenta VentureBeat y lo detalla la propia Mistral en su blog oficial. En lugar de devolver solo texto extraído, OCR 4 devuelve una representación completa de cada página: texto con su posición exacta en la página (bounding boxes), tipo de bloque (títulos, tablas, ecuaciones, firmas) y puntuación de confianza por palabra y por página. Todo eso desplegable en tu propio servidor, sin que los documentos salgan de tu infraestructura. Continúa leyendo «Mistral OCR 4: extracción documental estructurada en contenedor único, 170 idiomas y 4 dólares por millar de páginas»