Box integra sistema de reconocimiento de imágenes y texto en su servicio de almacenamiento online

box

En el blog de Google Box ha publicado un artículo “en modo invitado”, donde comentan la integración de un sistema de reconocimiento de fotos y de OCR en su plataforma de almacenamiento online.

El competidor de Dropbox informa que cuentan con miles de millones de imágenes de usuarios que deciden guardar todo tipo de documentos, desde formularios a facturas, pasando por recibos, contratos y un largo etcétera. El buscador de la plataforma debe ser capaz de encontrar texto en dichas imágenes, por lo que un sistema de identificación y reconocimiento de texto es imprescindible.

Han integrado también la misma tecnología que usa Google Fotos para etiquetar imágenes de forma automática, y han usado el reconocimiento óptico de caracteres (OCR) de Cloud Vision para poder reconocer incluso escritura a mano.

Sobre el resultado, comentan:

El uso de Google Cloud Vision fue sencillo, ya que la API acepta un archivo de imagen, analiza el contenido de la imagen y extrae las palabras impresas, devolviendo etiquetas y caracteres reconocidos en una respuesta JSON. Google Cloud Vision clasifica la imagen en categorías basadas en imágenes similares, analiza el contenido basado en el tipo de análisis proporcionado en la solicitud del desarrollador y devuelve los resultados y una puntuación de confianza en su análisis.

Para comunicarse de forma segura con Google Cloud Vision, utilizan la Biblioteca de cliente de API de Google para Java para establecer una conexión HTTPS a través de su servidor proxy, por lo que la información, aunque viaje por Internet, continúa siendo confidencial.

Juan Diego Polo

Estudió Ingeniería de Telecomunicaciones en la UPC (Barcelona), trabajando como ingeniero, profesor y analista desde 1998 hasta 2005, cuando decidió emprender creando wwwhatsnew.com.