Onlineocr – Una de las mejores formas de obtener texto a partir de PDFs e imágenes

ocr

Si recibís un archivo PDF o una imagen en la que el texto no se puede editar o copiar (para editarlo en otro programa) seguramente necesitaréis un sistema que sea capaz de reconocer lo que hay escrito en el documento y generar un texto plano para que podáis usarlo libremente.

Es ahí donde aparecen los famosos OCR, sistemas de reconocimiento de texto en imágenes que algunos servicios de almacenamiento de archivos ya incluyen como una funcionalidad adicional (es el caso de Google Drive, por ejemplo). Eso permite que cuando guardamos un documento en esos servicios, podamos obtener su contenido e incluso buscar caracteres dentro de ellos, algo necesario para quien guarda recibos escaneados, por ejemplo, o facturas de todo tipo en gif o jpg.

Pero si lo que necesitáis es una web que, sin necesidad de registro, solicite un archivo y un idioma e identifique y ofrezca el texto que hay dentro, entonces tenéis que echar un vistazo en onlineocr.net.

Los límites de las opciones gratuitas de este tipo de software suelen ser “solo reconozco la primera página de un pdf” o “reconozco 13 páginas de forma gratuita, luego has de pagar por cada una de ellas“. En este caso se trata de un límite de “número de páginas por hora“, lo que transforma a onlineocr en una excelente solución para los que tienen mucho que reconocer y no tienen prisa para ejecutar el trabajo sin necesidad de pagar nada.

Lleva muchos años funcionando y, aunque no tenga un diseño atractivo ni funcionalidades sorprendentes, sigue funcionando perfectamente en decenas de idiomas diferentes.

Imagen de texto en shutterstock.com

Juan Diego Polo

Estudió Ingeniería de Telecomunicaciones en la UPC (Barcelona), trabajando como ingeniero, profesor y analista desde 1998 hasta 2005, cuando decidió emprender creando wwwhatsnew.com.

1 comentario