Aplicaciones para pasar de imagen a texto (OCR)

Los OCR son sistemas de reconocimiento de texto en imágenes que algunos servicios de almacenamiento suelen incluir dentro de sus funcionalidades, con el fin de que al guardar estos documentos podamos utilizar su contenido.

El reconocimiento de caracteres designados con las siglas OCR, está basado en la digitalización de textos que reconocen de forma automática desde una imagen o PDF, el cual almacenará en forma de datos. De esta manera podremos utilizar dichos textos con otros sistemas de edición.  Continúa leyendo «Aplicaciones para pasar de imagen a texto (OCR)»

Una completa pero desconocida aplicación de OCR para Android

i2s

Si nos vamos al Play Store de Google y buscamos aplicaciones de reconocimiento de caracteres para nuestro dispositivo Android, encontraremos multitud de opciones entre las que elegir. Si buscamos algo sencillo, la búsqueda se nos hará bastante complicada por la gran diversidad de opciones existentes, aunque si buscamos algo más completo, entonces sí­ que podemos detenernos en mirar bien todo lo que nos ofrece I2S – Image to Speech.

Se trata de una aplicación completa que además del reconocimiento de los caracteres disponibles tanto en las imágenes que tengamos en nuestra librerí­a móvil como en las fotografí­as que realicemos con la cámara de nuestro dispositivo móvil, también cuenta con la posibilidad de realizar correcciones en el propio texto, capacidad de reproducir los textos ví­a voz con acento nativo gracias a su soporte para más de 45 idiomas, posibilidad de establecer traducciones a diferentes idiomas con soporte para hasta 70 idiomas diferentes, además de generar archivos PDF, posibilidad de copiar el texto al portapapeles del sistema y compartirlo con los contactos.
Continúa leyendo «Una completa pero desconocida aplicación de OCR para Android»

El sistema de reconocimiento de textos de Google ya reconoce más de 200 idiomas

Google dispone de un sistema capaz de reconocer el texto de imágenes y archivos PDF y transformarlo en un documento digital que pueda ser encontrado y editado. No es el único OCR ( Optical Character Recognition – reconocimiento óptico de caracteres) que existe en Internet, pero sí­ uno de los más eficaces.

Ayer mismo Google indicó que ya es posible reconocer textos en más de 200 idiomas, una tecnologí­a integrada en Google Drive. Solo tenemos que subir una imagen o PDF a nuestra cuenta y ver cómo se transforma en texto «por arte de magia», solo tenemos que pulsar en la opción del menú (del botón derecho) «abrir como Google Docs».

captura-88

No hay que especificar el idioma del documento, ya que Google hace ese trabajo de forma automática, un trabajo que también es hecho desde la versión android.

Indican en el artí­culo que este sistema de reconocimiento trabaja perfectamente con documentos bien escaneados, en prácticamente todas las tipografí­as existentes, aunque ya están trabajando para que sea igual de efectivo en manuscritos y en documentos capturados con cámaras de peor calidad y documentos de menor resolución.

Project Naptha, una extensión que nos permite copiar el texto que hay dentro de imágenes

Cuando vemos una imagen con un texto que queremos copiar solemos usar un sistema de reconocimiento de caracteres (OCR), motivo por el cual ya hemos indicado varios aquí­ en WWwhatsnew.com (personalmente uso éste).

Ahora os presentamos una opción que parece mucho más sencilla: Project Naptha (projectnaptha.com).

Se trata de una extensión de Chrome que detecta el texto de las imágenes y permite que sea posible copiarlo seleccionándolo con el ratón. Al pulsar el botón derecho sobre una selección de texto dentro de una imagen, veremos un menú que permitirá traducirlo, recortarlo y copiarlo, ayudando a tener un control absoluto sobre los caracteres que allí­ se encuentran (en su web podéis probarlo con el texto que aparece a la derecha, sin instalar la extensión).

Es rápido y, aunque aún es una versión muy primitiva, funciona bastante bien en las pruebas que hemos realizado, tanto en fotos como en capturas de pantalla o en cómics que encontramos en la web.

Quien sabe, es posible que en el futuro nos ayude a resolver captchas copiando y pegando su contenido. Lo que está claro es que es un paso importante en el mundo de los sistemas de reconocimiento de caracteres (OCR).

Convertii, para transformar PDF e imágenes a formato Word

Ya os hemos comentado en varias ocasiones herramientas OCR que ayudan a reconocer texto en documentos PDF y en imágenes, generando desde archivos .txt a documentos .doc. Hace unos años os hablamos de Free Online OCR, que permite elegir el formato de destino entre varios de una lista, y ahora os presentamos Convertii (convertii.com), otra opción que apuesta por sencillez en una aplicación libre de publicidad.

convertii

Aunque se presenta como una solución para transformar documentos PDF en DOC, también acepta imágenes como archivo de entrada, siempre solicitando el email para que pueda enviarnos el resultado después de reconocer le contenido del material que le hemos enviado.

Comentan en lifehacker que es posible también integrarlo en Dropbox para que transforme de forma automática todos los PDF que guardemos en un directorio especí­fico, algo que explican en su FAQ, para lo cual es necesario identificarse en la plataforma.

De hecho podemos usar Convertii sin necesidad de registro, pero solo es posible convertir 3 pdfs de esa forma, siendo necesario crear una cuenta para ampliar dicho lí­mite.

En este tipo de plataformas no podemos esperar resultados perfectos, generalmente se pierde el formato incluido en el pdf original, pero la mayorí­a del texto existente se suele reconocer sin problemas, ayudando así­ a editarlo posteriormente.

Onlineocr – Una de las mejores formas de obtener texto a partir de PDFs e imágenes

ocr

Si recibí­s un archivo PDF o una imagen en la que el texto no se puede editar o copiar (para editarlo en otro programa) seguramente necesitaréis un sistema que sea capaz de reconocer lo que hay escrito en el documento y generar un texto plano para que podáis usarlo libremente.

Es ahí­ donde aparecen los famosos OCR, sistemas de reconocimiento de texto en imágenes que algunos servicios de almacenamiento de archivos ya incluyen como una funcionalidad adicional (es el caso de Google Drive, por ejemplo). Eso permite que cuando guardamos un documento en esos servicios, podamos obtener su contenido e incluso buscar caracteres dentro de ellos, algo necesario para quien guarda recibos escaneados, por ejemplo, o facturas de todo tipo en gif o jpg.

Pero si lo que necesitáis es una web que, sin necesidad de registro, solicite un archivo y un idioma e identifique y ofrezca el texto que hay dentro, entonces tenéis que echar un vistazo en onlineocr.net.

Los lí­mites de las opciones gratuitas de este tipo de software suelen ser «solo reconozco la primera página de un pdf» o «reconozco 13 páginas de forma gratuita, luego has de pagar por cada una de ellas«. En este caso se trata de un lí­mite de «número de páginas por hora«, lo que transforma a onlineocr en una excelente solución para los que tienen mucho que reconocer y no tienen prisa para ejecutar el trabajo sin necesidad de pagar nada.

Lleva muchos años funcionando y, aunque no tenga un diseño atractivo ni funcionalidades sorprendentes, sigue funcionando perfectamente en decenas de idiomas diferentes.

Imagen de texto en shutterstock.com

Nueva versión de Doo, para gestionar documentos locales y en la nube desde el mismo lugar

doo

Desde doo (doo.net), asistente personal que nos permite gestionar documentos guardados tanto en Internet como en local, nos anuncian su nueva versión.

Esta herramienta conecta nuestros documentos de carpetas locales y servicios como Dropbox, Google Drive o SkyDrive, así­ como emails y cuentas en Evernote, para poder acceder a todos ellos desde un único panel.

Podemos encontrar información (documentos) de forma sencilla con la ventaja que tiene la clasificación automática de la información, algo que consiguen gracias al reconocimiento de caracteres.

[…] etiquetas inteligentes generadas automáticamente, como empresas, tipos de documento, formatos de archivo, personas, lugares o etiquetas individuales. Escanéalos con OCR y autoetiquetado como archivos PDF en los que se pueden realizar búsquedas de texto, y guárdalos directamente en la ubicación de almacenamiento que prefieras.

En doo 2.0 renuevan sus aplicaciones móviles, lanzan su versión para Windows 8, renuevan su aplicación de Mac y anuncian versiones para otras versiones de Windows 9nada de linux, de momento).

En su blog destacan la nueva aplicación para iPhone y su caracterí­stica de reconocimiento de caracteres:

Sólo tiene que mantener el iPhone sobre cualquier documento, recibo, tarjeta de visita, etc, y el asistente de escaneo avanzado captura automáticamente la mejor imagen posible. La imagen se guarda como PDF (realiza automáticamente OCR y etiquetado automático) en Dropbox, Google Drive o cualquiera de los servicios de almacenamiento disponible, así­ como en la biblioteca doo.

Os dejamos con los enlaces:

– doo para Android en la Tienda de Google Play: https://goo.gl/GOSwcp
– doo para iPhone en la App Store de iOS: https://goo.gl/Nep9A7
– doo para OS X en la App Store de Mac: https://goo.gl/2N8HNo
– doo para Windows 8: https://goo.gl/MCyDTY

Microsoft anuncia OCR para las fotografí­as en SkyDrive

El equipo de Microsoft en las últimas semanas ha dado atención especial en mejorar la experiencia al subir y almacenar fotografí­as en SkyDrive. Ahora ha dado un paso más allá con una nueva caracterí­stica, la posibilidad de utilizar herramienta de OCR gracias a su asociación con el equipo de Bing.

A través de esta tecnologí­a podremos extraer texto de las imágenes capturadas en el momento con nuestro dispositivo móvil, visualizándolas desde SkyDrive, tal como se ve en la imagen.

SkyDrive

Para lograr ello tenemos que cumplir con una serie de condiciones, tal como explican desde el blog de Windows, como por ejemplo tener activada la opción de carga automática a Skydrive desde nuestro Windows Phone.  Esta herramienta funcionará automáticamente una vez que la fotografí­a capturada sea enviada a nuestra carpeta de SkyDrive.com, mostrando el texto extraí­do.

Esta nueva caracterí­stica que podrán utilizar los usuarios de SkyDrive tiene soporte para español, inglés, francés y alemán, dependiendo exclusivamente de la configuración del navegador. Una opción interesante a tener en cuenta, que nos permite combinar las bondades de la cámara del dispositivo y disponer de información que nos puede resultar útil sin complicarnos con opciones adicionales.

De esa forma, desde el equipo de Microsoft pretenden seguir con la dinámica de potenciar el servicio que ofrecen SkyDrive, y que en el caso de las fotografí­as no sea solo mejoras de interfaz y rendimiento, sino que también actualizaciones que reflejen nuevas funciones y herramientas.

Fileee, para escanear documentos desde el móvil, ya llegó a Android

fileee (fileee.com) se presenta como un asistente personal enfocado en la organización de documentos, permitiendo crear versiones digitales de todos los papeles que nos rodean constantemente. La aplicación reconoce los caracteres que escaneamos, usando su propio OCR, por lo que puede ser una buena alternativa a camscanner.net, uno de los lí­deres en esta categorí­a.

La idea es que al escanear una factura, por ejemplo, Fileee detecte la empresa, la dirección, la fecha y demás datos que servirán para clasificar automáticamente el documento, aunque siempre es posible especificar los detalles manualmente.

La aplicación puede usarse desde la web y desde móviles. En los dos casos (ya sea mediante upload o mediante fotografí­a del papel) se reconocerá el contenido. Aunque de momento solo esté disponible en inglés y alemán, hay textos sencillos de reconocer en cualquier idioma, por lo que no deberí­a ser un problema utilizarlo en nuestro idioma.

Todos los documentos disponibles en nuestra cuenta web pueden ser compartidos fácilmente, así­ como reorganizados y eliminados, en caso de que así­ lo deseemos. Podemos incluso enviarlos directamente por email o guardarlos en nuestra cuenta de Dropbox de forma automática, ayudando así­ a tener un backup «tradicional» de todo lo que escaneamos.

Una gran solución que por fin abre las puertas al mundo android.

Gracias a Pablo del Pozo por el enlace.

Google Drive para Android, nueva y genial versión

Drive

Google acaba de presentar una serie de mejoras que han sido implementadas en su aplicación Drive para terminales Android. La idea de estas implementaciones van encaminadas a la mejora de la creación, acceso, y gestión de los documentos en nuestra cuenta de usuario.

Es por ello por lo que a partir de ahora, podemos contar con un nuevo tipo de vista que nos permitirá acceder a los documentos de forma más fácil. Esta vista nos proporciona un estilo similar a las de las tarjetas, permitiéndonos navegar sobre ellas y ver por encima sus contenidos rápidamente gracias a la vista previa incorporada. Además, si queremos incluir y hacer seguimiento de documentos importantes, ahora podemos escanear los documentos con la cámara de nuestro terminal, guardándolos como archivos PDF. Gracias a la tecnologí­a OCR, podemos realizar la búsqueda del documento deseado.

La descarga de copias de archivos a nuestro dispositivo, las mejoras en la edición de hojas de cálculo con los cambios de fuentes, colores y alineaciones de celdas, el soporte para Cloud Print, la posibilidad de visualización de las propiedades de los archivos en los editores, así­ como la solución de errores y mejoras visuales, completan las mejoras de Drive para Android, que podemos adquirir desde ya a través de Google Play, disponible para terminales Android 2.1 en adelante.

Enlace: Drive en Google Play | Ví­a: Blog oficial de Android