Los OCR son sistemas de reconocimiento de texto en imágenes que algunos servicios de almacenamiento suelen incluir dentro de sus funcionalidades, con el fin de que al guardar estos documentos podamos utilizar su contenido.
El reconocimiento de caracteres designados con las siglas OCR, está basado en la digitalización de textos que reconocen de forma automática desde una imagen o PDF, el cual almacenará en forma de datos. De esta manera podremos utilizar dichos textos con otros sistemas de edición. Continúa leyendo «Aplicaciones para pasar de imagen a texto (OCR)»
Si nos vamos al Play Store de Google y buscamos aplicaciones de reconocimiento de caracteres para nuestro dispositivo Android, encontraremos multitud de opciones entre las que elegir. Si buscamos algo sencillo, la búsqueda se nos hará bastante complicada por la gran diversidad de opciones existentes, aunque si buscamos algo más completo, entonces sí que podemos detenernos en mirar bien todo lo que nos ofrece I2S – Image to Speech.
Se trata de una aplicación completa que además del reconocimiento de los caracteres disponibles tanto en las imágenes que tengamos en nuestra librería móvil como en las fotografías que realicemos con la cámara de nuestro dispositivo móvil, también cuenta con la posibilidad de realizar correcciones en el propio texto, capacidad de reproducir los textos vía voz con acento nativo gracias a su soporte para más de 45 idiomas, posibilidad de establecer traducciones a diferentes idiomas con soporte para hasta 70 idiomas diferentes, además de generar archivos PDF, posibilidad de copiar el texto al portapapeles del sistema y compartirlo con los contactos. Continúa leyendo «Una completa pero desconocida aplicación de OCR para Android»
Google dispone de un sistema capaz de reconocer el texto de imágenes y archivos PDF y transformarlo en un documento digital que pueda ser encontrado y editado. No es el único OCR ( Optical Character Recognition – reconocimiento óptico de caracteres) que existe en Internet, pero sí uno de los más eficaces.
Ayer mismo Google indicó que ya es posible reconocer textos en más de 200 idiomas, una tecnología integrada en Google Drive. Solo tenemos que subir una imagen o PDF a nuestra cuenta y ver cómo se transforma en texto «por arte de magia», solo tenemos que pulsar en la opción del menú (del botón derecho) «abrir como Google Docs».
No hay que especificar el idioma del documento, ya que Google hace ese trabajo de forma automática, un trabajo que también es hecho desde la versión android.
Indican en el artículo que este sistema de reconocimiento trabaja perfectamente con documentos bien escaneados, en prácticamente todas las tipografías existentes, aunque ya están trabajando para que sea igual de efectivo en manuscritos y en documentos capturados con cámaras de peor calidad y documentos de menor resolución.
Cuando vemos una imagen con un texto que queremos copiar solemos usar un sistema de reconocimiento de caracteres (OCR), motivo por el cual ya hemos indicado varios aquí en WWwhatsnew.com (personalmente uso éste).
Ahora os presentamos una opción que parece mucho más sencilla: Project Naptha (projectnaptha.com).
Se trata de una extensión de Chrome que detecta el texto de las imágenes y permite que sea posible copiarlo seleccionándolo con el ratón. Al pulsar el botón derecho sobre una selección de texto dentro de una imagen, veremos un menú que permitirá traducirlo, recortarlo y copiarlo, ayudando a tener un control absoluto sobre los caracteres que allí se encuentran (en su web podéis probarlo con el texto que aparece a la derecha, sin instalar la extensión).
Es rápido y, aunque aún es una versión muy primitiva, funciona bastante bien en las pruebas que hemos realizado, tanto en fotos como en capturas de pantalla o en cómics que encontramos en la web.
Quien sabe, es posible que en el futuro nos ayude a resolver captchas copiando y pegando su contenido. Lo que está claro es que es un paso importante en el mundo de los sistemas de reconocimiento de caracteres (OCR).
Ya os hemos comentado en varias ocasiones herramientas OCR que ayudan a reconocer texto en documentos PDF y en imágenes, generando desde archivos .txt a documentos .doc. Hace unos años os hablamos de Free Online OCR, que permite elegir el formato de destino entre varios de una lista, y ahora os presentamos Convertii (convertii.com), otra opción que apuesta por sencillez en una aplicación libre de publicidad.
Aunque se presenta como una solución para transformar documentos PDF en DOC, también acepta imágenes como archivo de entrada, siempre solicitando el email para que pueda enviarnos el resultado después de reconocer le contenido del material que le hemos enviado.
Comentan en lifehacker que es posible también integrarlo en Dropbox para que transforme de forma automática todos los PDF que guardemos en un directorio específico, algo que explican en su FAQ, para lo cual es necesario identificarse en la plataforma.
De hecho podemos usar Convertii sin necesidad de registro, pero solo es posible convertir 3 pdfs de esa forma, siendo necesario crear una cuenta para ampliar dicho límite.
En este tipo de plataformas no podemos esperar resultados perfectos, generalmente se pierde el formato incluido en el pdf original, pero la mayoría del texto existente se suele reconocer sin problemas, ayudando así a editarlo posteriormente.
Si recibís un archivo PDF o una imagen en la que el texto no se puede editar o copiar (para editarlo en otro programa) seguramente necesitaréis un sistema que sea capaz de reconocer lo que hay escrito en el documento y generar un texto plano para que podáis usarlo libremente.
Es ahí donde aparecen los famosos OCR, sistemas de reconocimiento de texto en imágenes que algunos servicios de almacenamiento de archivos ya incluyen como una funcionalidad adicional (es el caso de Google Drive, por ejemplo). Eso permite que cuando guardamos un documento en esos servicios, podamos obtener su contenido e incluso buscar caracteres dentro de ellos, algo necesario para quien guarda recibos escaneados, por ejemplo, o facturas de todo tipo en gif o jpg.
Pero si lo que necesitáis es una web que, sin necesidad de registro, solicite un archivo y un idioma e identifique y ofrezca el texto que hay dentro, entonces tenéis que echar un vistazo en onlineocr.net.
Los límites de las opciones gratuitas de este tipo de software suelen ser «solo reconozco la primera página de un pdf» o «reconozco 13 páginas de forma gratuita, luego has de pagar por cada una de ellas«. En este caso se trata de un límite de «número de páginas por hora«, lo que transforma a onlineocr en una excelente solución para los que tienen mucho que reconocer y no tienen prisa para ejecutar el trabajo sin necesidad de pagar nada.
Lleva muchos años funcionando y, aunque no tenga un diseño atractivo ni funcionalidades sorprendentes, sigue funcionando perfectamente en decenas de idiomas diferentes.
Desde doo (doo.net), asistente personal que nos permite gestionar documentos guardados tanto en Internet como en local, nos anuncian su nueva versión.
Esta herramienta conecta nuestros documentos de carpetas locales y servicios como Dropbox, Google Drive o SkyDrive, así como emails y cuentas en Evernote, para poder acceder a todos ellos desde un único panel.
Podemos encontrar información (documentos) de forma sencilla con la ventaja que tiene la clasificación automática de la información, algo que consiguen gracias al reconocimiento de caracteres.
[…] etiquetas inteligentes generadas automáticamente, como empresas, tipos de documento, formatos de archivo, personas, lugares o etiquetas individuales. Escanéalos con OCR y autoetiquetado como archivos PDF en los que se pueden realizar búsquedas de texto, y guárdalos directamente en la ubicación de almacenamiento que prefieras.
En doo 2.0 renuevan sus aplicaciones móviles, lanzan su versión para Windows 8, renuevan su aplicación de Mac y anuncian versiones para otras versiones de Windows 9nada de linux, de momento).
En su blog destacan la nueva aplicación para iPhone y su característica de reconocimiento de caracteres:
Sólo tiene que mantener el iPhone sobre cualquier documento, recibo, tarjeta de visita, etc, y el asistente de escaneo avanzado captura automáticamente la mejor imagen posible. La imagen se guarda como PDF (realiza automáticamente OCR y etiquetado automático) en Dropbox, Google Drive o cualquiera de los servicios de almacenamiento disponible, así como en la biblioteca doo.
El equipo de Microsoft en las últimas semanas ha dado atención especial en mejorar la experiencia al subir y almacenar fotografías en SkyDrive. Ahora ha dado un paso más allá con una nueva característica, la posibilidad de utilizar herramienta de OCR gracias a su asociación con el equipo de Bing.
A través de esta tecnología podremos extraer texto de las imágenes capturadas en el momento con nuestro dispositivo móvil, visualizándolas desde SkyDrive, tal como se ve en la imagen.
Para lograr ello tenemos que cumplir con una serie de condiciones, tal como explican desde el blog de Windows, como por ejemplo tener activada la opción de carga automática a Skydrive desde nuestro Windows Phone. Esta herramienta funcionará automáticamente una vez que la fotografía capturada sea enviada a nuestra carpeta de SkyDrive.com, mostrando el texto extraído.
Esta nueva característica que podrán utilizar los usuarios de SkyDrive tiene soporte para español, inglés, francés y alemán, dependiendo exclusivamente de la configuración del navegador. Una opción interesante a tener en cuenta, que nos permite combinar las bondades de la cámara del dispositivo y disponer de información que nos puede resultar útil sin complicarnos con opciones adicionales.
De esa forma, desde el equipo de Microsoft pretenden seguir con la dinámica de potenciar el servicio que ofrecen SkyDrive, y que en el caso de las fotografías no sea solo mejoras de interfaz y rendimiento, sino que también actualizaciones que reflejen nuevas funciones y herramientas.
fileee (fileee.com) se presenta como un asistente personal enfocado en la organización de documentos, permitiendo crear versiones digitales de todos los papeles que nos rodean constantemente. La aplicación reconoce los caracteres que escaneamos, usando su propio OCR, por lo que puede ser una buena alternativa a camscanner.net, uno de los líderes en esta categoría.
La idea es que al escanear una factura, por ejemplo, Fileee detecte la empresa, la dirección, la fecha y demás datos que servirán para clasificar automáticamente el documento, aunque siempre es posible especificar los detalles manualmente.
La aplicación puede usarse desde la web y desde móviles. En los dos casos (ya sea mediante upload o mediante fotografía del papel) se reconocerá el contenido. Aunque de momento solo esté disponible en inglés y alemán, hay textos sencillos de reconocer en cualquier idioma, por lo que no debería ser un problema utilizarlo en nuestro idioma.
Todos los documentos disponibles en nuestra cuenta web pueden ser compartidos fácilmente, así como reorganizados y eliminados, en caso de que así lo deseemos. Podemos incluso enviarlos directamente por email o guardarlos en nuestra cuenta de Dropbox de forma automática, ayudando así a tener un backup «tradicional» de todo lo que escaneamos.
Una gran solución que por fin abre las puertas al mundo android.
Google acaba de presentar una serie de mejoras que han sido implementadas en su aplicación Drive para terminales Android. La idea de estas implementaciones van encaminadas a la mejora de la creación, acceso, y gestión de los documentos en nuestra cuenta de usuario.
Es por ello por lo que a partir de ahora, podemos contar con un nuevo tipo de vista que nos permitirá acceder a los documentos de forma más fácil. Esta vista nos proporciona un estilo similar a las de las tarjetas, permitiéndonos navegar sobre ellas y ver por encima sus contenidos rápidamente gracias a la vista previa incorporada. Además, si queremos incluir y hacer seguimiento de documentos importantes, ahora podemos escanear los documentos con la cámara de nuestro terminal, guardándolos como archivos PDF. Gracias a la tecnología OCR, podemos realizar la búsqueda del documento deseado.
La descarga de copias de archivos a nuestro dispositivo, las mejoras en la edición de hojas de cálculo con los cambios de fuentes, colores y alineaciones de celdas, el soporte para Cloud Print, la posibilidad de visualización de las propiedades de los archivos en los editores, así como la solución de errores y mejoras visuales, completan las mejoras de Drive para Android, que podemos adquirir desde ya a través de Google Play, disponible para terminales Android 2.1 en adelante.