El sistema de reconocimiento de textos de Google ya reconoce más de 200 idiomas

Google dispone de un sistema capaz de reconocer el texto de imágenes y archivos PDF y transformarlo en un documento digital que pueda ser encontrado y editado. No es el único OCR ( Optical Character Recognition – reconocimiento óptico de caracteres) que existe en Internet, pero sí­ uno de los más eficaces.

Ayer mismo Google indicó que ya es posible reconocer textos en más de 200 idiomas, una tecnologí­a integrada en Google Drive. Solo tenemos que subir una imagen o PDF a nuestra cuenta y ver cómo se transforma en texto «por arte de magia», solo tenemos que pulsar en la opción del menú (del botón derecho) «abrir como Google Docs».

captura-88

No hay que especificar el idioma del documento, ya que Google hace ese trabajo de forma automática, un trabajo que también es hecho desde la versión android.

Indican en el artí­culo que este sistema de reconocimiento trabaja perfectamente con documentos bien escaneados, en prácticamente todas las tipografí­as existentes, aunque ya están trabajando para que sea igual de efectivo en manuscritos y en documentos capturados con cámaras de peor calidad y documentos de menor resolución.

Project Naptha, una extensión que nos permite copiar el texto que hay dentro de imágenes

Cuando vemos una imagen con un texto que queremos copiar solemos usar un sistema de reconocimiento de caracteres (OCR), motivo por el cual ya hemos indicado varios aquí­ en WWwhatsnew.com (personalmente uso éste).

Ahora os presentamos una opción que parece mucho más sencilla: Project Naptha (projectnaptha.com).

Se trata de una extensión de Chrome que detecta el texto de las imágenes y permite que sea posible copiarlo seleccionándolo con el ratón. Al pulsar el botón derecho sobre una selección de texto dentro de una imagen, veremos un menú que permitirá traducirlo, recortarlo y copiarlo, ayudando a tener un control absoluto sobre los caracteres que allí­ se encuentran (en su web podéis probarlo con el texto que aparece a la derecha, sin instalar la extensión).

Es rápido y, aunque aún es una versión muy primitiva, funciona bastante bien en las pruebas que hemos realizado, tanto en fotos como en capturas de pantalla o en cómics que encontramos en la web.

Quien sabe, es posible que en el futuro nos ayude a resolver captchas copiando y pegando su contenido. Lo que está claro es que es un paso importante en el mundo de los sistemas de reconocimiento de caracteres (OCR).

Convertii, para transformar PDF e imágenes a formato Word

Ya os hemos comentado en varias ocasiones herramientas OCR que ayudan a reconocer texto en documentos PDF y en imágenes, generando desde archivos .txt a documentos .doc. Hace unos años os hablamos de Free Online OCR, que permite elegir el formato de destino entre varios de una lista, y ahora os presentamos Convertii (convertii.com), otra opción que apuesta por sencillez en una aplicación libre de publicidad.

convertii

Aunque se presenta como una solución para transformar documentos PDF en DOC, también acepta imágenes como archivo de entrada, siempre solicitando el email para que pueda enviarnos el resultado después de reconocer le contenido del material que le hemos enviado.

Comentan en lifehacker que es posible también integrarlo en Dropbox para que transforme de forma automática todos los PDF que guardemos en un directorio especí­fico, algo que explican en su FAQ, para lo cual es necesario identificarse en la plataforma.

De hecho podemos usar Convertii sin necesidad de registro, pero solo es posible convertir 3 pdfs de esa forma, siendo necesario crear una cuenta para ampliar dicho lí­mite.

En este tipo de plataformas no podemos esperar resultados perfectos, generalmente se pierde el formato incluido en el pdf original, pero la mayorí­a del texto existente se suele reconocer sin problemas, ayudando así­ a editarlo posteriormente.

Onlineocr – Una de las mejores formas de obtener texto a partir de PDFs e imágenes

ocr

Si recibí­s un archivo PDF o una imagen en la que el texto no se puede editar o copiar (para editarlo en otro programa) seguramente necesitaréis un sistema que sea capaz de reconocer lo que hay escrito en el documento y generar un texto plano para que podáis usarlo libremente.

Es ahí­ donde aparecen los famosos OCR, sistemas de reconocimiento de texto en imágenes que algunos servicios de almacenamiento de archivos ya incluyen como una funcionalidad adicional (es el caso de Google Drive, por ejemplo). Eso permite que cuando guardamos un documento en esos servicios, podamos obtener su contenido e incluso buscar caracteres dentro de ellos, algo necesario para quien guarda recibos escaneados, por ejemplo, o facturas de todo tipo en gif o jpg.

Pero si lo que necesitáis es una web que, sin necesidad de registro, solicite un archivo y un idioma e identifique y ofrezca el texto que hay dentro, entonces tenéis que echar un vistazo en onlineocr.net.

Los lí­mites de las opciones gratuitas de este tipo de software suelen ser «solo reconozco la primera página de un pdf» o «reconozco 13 páginas de forma gratuita, luego has de pagar por cada una de ellas«. En este caso se trata de un lí­mite de «número de páginas por hora«, lo que transforma a onlineocr en una excelente solución para los que tienen mucho que reconocer y no tienen prisa para ejecutar el trabajo sin necesidad de pagar nada.

Lleva muchos años funcionando y, aunque no tenga un diseño atractivo ni funcionalidades sorprendentes, sigue funcionando perfectamente en decenas de idiomas diferentes.

Imagen de texto en shutterstock.com

Nueva versión de Doo, para gestionar documentos locales y en la nube desde el mismo lugar

doo

Desde doo (doo.net), asistente personal que nos permite gestionar documentos guardados tanto en Internet como en local, nos anuncian su nueva versión.

Esta herramienta conecta nuestros documentos de carpetas locales y servicios como Dropbox, Google Drive o SkyDrive, así­ como emails y cuentas en Evernote, para poder acceder a todos ellos desde un único panel.

Podemos encontrar información (documentos) de forma sencilla con la ventaja que tiene la clasificación automática de la información, algo que consiguen gracias al reconocimiento de caracteres.

[…] etiquetas inteligentes generadas automáticamente, como empresas, tipos de documento, formatos de archivo, personas, lugares o etiquetas individuales. Escanéalos con OCR y autoetiquetado como archivos PDF en los que se pueden realizar búsquedas de texto, y guárdalos directamente en la ubicación de almacenamiento que prefieras.

En doo 2.0 renuevan sus aplicaciones móviles, lanzan su versión para Windows 8, renuevan su aplicación de Mac y anuncian versiones para otras versiones de Windows 9nada de linux, de momento).

En su blog destacan la nueva aplicación para iPhone y su caracterí­stica de reconocimiento de caracteres:

Sólo tiene que mantener el iPhone sobre cualquier documento, recibo, tarjeta de visita, etc, y el asistente de escaneo avanzado captura automáticamente la mejor imagen posible. La imagen se guarda como PDF (realiza automáticamente OCR y etiquetado automático) en Dropbox, Google Drive o cualquiera de los servicios de almacenamiento disponible, así­ como en la biblioteca doo.

Os dejamos con los enlaces:

– doo para Android en la Tienda de Google Play: https://goo.gl/GOSwcp
– doo para iPhone en la App Store de iOS: https://goo.gl/Nep9A7
– doo para OS X en la App Store de Mac: https://goo.gl/2N8HNo
– doo para Windows 8: https://goo.gl/MCyDTY

Microsoft anuncia OCR para las fotografí­as en SkyDrive

El equipo de Microsoft en las últimas semanas ha dado atención especial en mejorar la experiencia al subir y almacenar fotografí­as en SkyDrive. Ahora ha dado un paso más allá con una nueva caracterí­stica, la posibilidad de utilizar herramienta de OCR gracias a su asociación con el equipo de Bing.

A través de esta tecnologí­a podremos extraer texto de las imágenes capturadas en el momento con nuestro dispositivo móvil, visualizándolas desde SkyDrive, tal como se ve en la imagen.

SkyDrive

Para lograr ello tenemos que cumplir con una serie de condiciones, tal como explican desde el blog de Windows, como por ejemplo tener activada la opción de carga automática a Skydrive desde nuestro Windows Phone.  Esta herramienta funcionará automáticamente una vez que la fotografí­a capturada sea enviada a nuestra carpeta de SkyDrive.com, mostrando el texto extraí­do.

Esta nueva caracterí­stica que podrán utilizar los usuarios de SkyDrive tiene soporte para español, inglés, francés y alemán, dependiendo exclusivamente de la configuración del navegador. Una opción interesante a tener en cuenta, que nos permite combinar las bondades de la cámara del dispositivo y disponer de información que nos puede resultar útil sin complicarnos con opciones adicionales.

De esa forma, desde el equipo de Microsoft pretenden seguir con la dinámica de potenciar el servicio que ofrecen SkyDrive, y que en el caso de las fotografí­as no sea solo mejoras de interfaz y rendimiento, sino que también actualizaciones que reflejen nuevas funciones y herramientas.

Fileee, para escanear documentos desde el móvil, ya llegó a Android

fileee (fileee.com) se presenta como un asistente personal enfocado en la organización de documentos, permitiendo crear versiones digitales de todos los papeles que nos rodean constantemente. La aplicación reconoce los caracteres que escaneamos, usando su propio OCR, por lo que puede ser una buena alternativa a camscanner.net, uno de los lí­deres en esta categorí­a.

La idea es que al escanear una factura, por ejemplo, Fileee detecte la empresa, la dirección, la fecha y demás datos que servirán para clasificar automáticamente el documento, aunque siempre es posible especificar los detalles manualmente.

La aplicación puede usarse desde la web y desde móviles. En los dos casos (ya sea mediante upload o mediante fotografí­a del papel) se reconocerá el contenido. Aunque de momento solo esté disponible en inglés y alemán, hay textos sencillos de reconocer en cualquier idioma, por lo que no deberí­a ser un problema utilizarlo en nuestro idioma.

Todos los documentos disponibles en nuestra cuenta web pueden ser compartidos fácilmente, así­ como reorganizados y eliminados, en caso de que así­ lo deseemos. Podemos incluso enviarlos directamente por email o guardarlos en nuestra cuenta de Dropbox de forma automática, ayudando así­ a tener un backup «tradicional» de todo lo que escaneamos.

Una gran solución que por fin abre las puertas al mundo android.

Gracias a Pablo del Pozo por el enlace.

Google Drive para Android, nueva y genial versión

Drive

Google acaba de presentar una serie de mejoras que han sido implementadas en su aplicación Drive para terminales Android. La idea de estas implementaciones van encaminadas a la mejora de la creación, acceso, y gestión de los documentos en nuestra cuenta de usuario.

Es por ello por lo que a partir de ahora, podemos contar con un nuevo tipo de vista que nos permitirá acceder a los documentos de forma más fácil. Esta vista nos proporciona un estilo similar a las de las tarjetas, permitiéndonos navegar sobre ellas y ver por encima sus contenidos rápidamente gracias a la vista previa incorporada. Además, si queremos incluir y hacer seguimiento de documentos importantes, ahora podemos escanear los documentos con la cámara de nuestro terminal, guardándolos como archivos PDF. Gracias a la tecnologí­a OCR, podemos realizar la búsqueda del documento deseado.

La descarga de copias de archivos a nuestro dispositivo, las mejoras en la edición de hojas de cálculo con los cambios de fuentes, colores y alineaciones de celdas, el soporte para Cloud Print, la posibilidad de visualización de las propiedades de los archivos en los editores, así­ como la solución de errores y mejoras visuales, completan las mejoras de Drive para Android, que podemos adquirir desde ya a través de Google Play, disponible para terminales Android 2.1 en adelante.

Enlace: Drive en Google Play | Ví­a: Blog oficial de Android

Transformando de PDF a texto, word, excel… desde Android y iOS

Able2Extract

Nos presentan la aplicación Able2Extract (investintech.com), disponible de forma gratuita para Android y iOS (iPhone, iPod y iPad), como una herramienta para crear archivos PDF y transformar documentos de y a dicho formato.

Solo tenemos que seleccionar el fichero pdf deseado y elegir el formato de destino, permitiendo que la aplicación use su propio sistema de reconocimiento de caracteres para generar la información y ofrecer el archivo.

Podemos también crear PDFs, no solo reconocerlos, siendo el proceso más sencillo, ya que no necesita usar ningún OCR para ello.

No es la primera vez que hablamos de aplicaciones OCR para móviles, ya os algunas opciones aquí­, pero sí­ es la primera vez que lo vemos para poder editar archivos PDF.

3 aplicaciones de reconocimiento de caracteres en Android

En varias ocasiones os hemos hablado de aplicaciones que permiten reconocer texto después de fotografiarse con algún dispositivo móvil. Esta función es extremadamente importante en el sector de turismo, por ejemplo, ya que podemos enfocar un texto en un idioma desconocido y obtener la traducción de forma inmediata, aunque muchas personas utilizan dicha tecnologí­a para escanear documentos en papel y obtener una versión que pueda editarse fácilmente.

En la web ya existen muchas opciones relacionadas con OCR (Optical Character Recognition), aquí­ ya os hemos comentado varias pero nada más práctico que capturar el texto con una cámara.

Os dejamos aquí­ con una serie de opciones que pueden utilizarse en los sistemas Android, esperando que ampliéis la lista con alguna aplicación que os haya sido de utilidad en algún momento.

Mobile OCR Free permite fotografiar documentos y obtener el texto que en ellos se encuentra.

Es compatible con 25 idiomas diferentes, pero hace casi un año que no se actualiza con nuevas funcionalidades.

Ésta es la versión gratuita, bastante popular en el market de Android, existiendo una versión de pago que ha recibido muchas crí­ticas negativas por haber dejado de funcionar después de usarse repetidas veces.

Google Goggles es uno de los reyes de la categorí­a, permitiendo reconocer texto e imágenes desde los dispositivos móviles. Google creó esta aplicación en 2009 con el objetivo de permitir realizar búsquedas usando la cámara del móvil, reconociendo desde cuadros famosos a lugares populares, códigos QR, logos, productos, etc.

También puede reconocer texto en francés, inglés, italiano, español, portugués, turco y ruso, traduciéndolo a otros idiomas usando el motor de Google Translate, resuelve sudokus, busca productos similares, añade contactos fotografiando una tarjeta de visita… una aplicación imprescindible en todo Android que se precie.

ABBYY TextGrabber + Translator usa una tecnologí­a de reconocimiento de caracteres propia, reconociendo textos fotografiados en 60 idiomas que pueden ser traducidos a otros idiomas usando otra solución del mismo desarrollador.

Funciona con Android 2.2 o superior y permite editar inmediatamente el texto reconocido ofreciendo la posibilidad de enviarlo a las redes sociales, guardarlo en Evernote o compartirlo ví­a DropBox, siendo posible también enviarlo por email o SMS.

No es una solución gratuita, como podéis ver en la captura, aunque es una de las más populares en esta categorí­a.