Qué es LlaVA, la IA que reconoce imágenes y habla sobre ellas

Cuando hablamos de usar la Inteligencia Artificial en el día a día tendemos a pensar en ChatGPT y en cualquiera de los usos que podemos darle, pero el caso es que la IA es mucho más que ChatGPT, Midjourney y Runway, la IA está en todos los sectores, con modelos que van naciendo para destacarse de una u otra forma.
Continúa leyendo «Qué es LlaVA, la IA que reconoce imágenes y habla sobre ellas»

Cómo extraer textos de una imagen en iPhone

ocrX emerge como una solución innovadora en el campo de la tecnología OCR (Reconocimiento Óptico de Caracteres), diseñada específicamente para iPads y iPhones. Este artículo se sumerge en las características y funcionalidades de la aplicación, desarrollada por Aculix Technologies LLP, desglosando cada aspecto clave para proporcionar una comprensión integral de lo que ofrece.

Recordad que publiqué en 2020 una lista de aplicaciones para pasar de imágenes a texto que sigue estando actualizada.

Continúa leyendo «Cómo extraer textos de una imagen en iPhone»

Tecnología de reconocimiento de escritura, opciones y tendencias

El reconocimiento de escritura es una de las áreas más fascinantes y en rápido desarrollo dentro del campo de la inteligencia artificial y el procesamiento de datos. Esta tecnología tiene el potencial de transformar la forma en que interactuamos con las máquinas, ofreciendo una interfaz más natural y accesible.

En la era digital, la capacidad para convertir texto escrito en datos estructurados es invaluable. Ya sea en el ámbito de la automatización empresarial, donde se digitalizan grandes volúmenes de documentos, o en aplicaciones de consumo como asistentes virtuales y dispositivos móviles, el reconocimiento de escritura está cambiando la forma en que interactuamos con la tecnología. Continúa leyendo «Tecnología de reconocimiento de escritura, opciones y tendencias»

Airparser, asistente de extracción de datos impulsado por GPT-4

La extracción de datos se ha convertido en una tarea crucial en la era digital. Desde la gestión de correos electrónicos hasta el análisis de contratos, la necesidad de herramientas que faciliten este proceso es evidente. Aquí es donde entra en juego Airparser, una solución que promete agilizar la extracción de datos de documentos no estructurados. Continúa leyendo «Airparser, asistente de extracción de datos impulsado por GPT-4»

Una extensión para extraer texto de fotos, vídeos, documentos y más

Existen muchas herramientas OCR en Internet, sitios web y aplicaciones diversas que extraen el texto de una imagen, algo muy útil para evitar perder el tiempo escribiendo lo que otra persona ya escribió en su momento.

Entre todas esas herramientas me gustan especialmente las de este artículos de OCR gratuitos, aunque la que he conocido hoy es realmente interesante, basada en un plugin de Chrome. Continúa leyendo «Una extensión para extraer texto de fotos, vídeos, documentos y más»

Inteligencia artificial para conocer más sobre la historia de la humanidad

Cuando hablamos de Inteligencia Artificial parece que siempre hablamos sobre cómo podemos mejorar el futuro y hacer más productivo el presente, pero en algunas ocasiones puede ayudar mucho a descubrir más sobre nuestro pasado.

Ya se usa en algunas ramas de la arqueología, y hoy os hablaré de un sistema utilizado para descubrir personas famosas en documentos antiguos. Continúa leyendo «Inteligencia artificial para conocer más sobre la historia de la humanidad»

OCR Scanner, extensión para extraer texto de imágenes con traductor incluido

Tiempo atrás, compartimos una extensa selección de aplicaciones y servicios web para extraer texto desde imágenes

La lista suma y sigue. Una solución diferente llega de la mano de OCR Scanner, una extensión gratuita para Chrome que incorpora un traductor.

Continúa leyendo «OCR Scanner, extensión para extraer texto de imágenes con traductor incluido»

Cómo reconocer el texto de fotos guardadas en Google Fotos

Hace poco que Google Fotos decidió incorporar a Google Lens dentro de la app, lo que hace que ahora sea sencillo reconocer el texto de los documentos que hemos subido en la plataforma.

Para hacerlo basta con buscar una imagen que tenga texto dentro. Si hay mucho texto, Google Fotos lo detectará automáticamente, sin necesidad de que hagamos nada, y nos invitará a copiar el texto en el portapapeles, tal y como podéis ver en la imagen superior. Continúa leyendo «Cómo reconocer el texto de fotos guardadas en Google Fotos»

Un escáner de documentos que permite extraer tablas y exportarlas a Excel

Las herramientas para escanear documentos y extraer textos de ellos no son algo nuevo. La tecnología de reconocimiento óptico de caracteres (OCR) se puede encontrar en software para casi cualquier plataforma, incluyendo plataformas web.

Lo interesante con esto es cuando irrumpen en el medio opciones que refrescan la propuesta con algo novedoso y asequible. Este es el caso de Docsumo.

Continúa leyendo «Un escáner de documentos que permite extraer tablas y exportarlas a Excel»

Un teclado para móviles que escanea imágenes para copiar el texto

Si tenemos un texto en el papel y queremos tener una versión digital y editable del mismo, tenemos dos opciones:

– Escribimos a mano con el teclado lo que vamos leyendo en el papel.
– Hacemos una foto y usamos una aplicación de reconocimiento de caracteres (OCR) que transforme el texto de la imagen en texto editable.

En WWWhatsnew ya hemos hablado en muchas ocasiones de soluciones OCR, y hoy veremos una presentada como teclado para móviles. Continúa leyendo «Un teclado para móviles que escanea imágenes para copiar el texto»