A partir del próximo lunes, el servicio Azure Data Catalog de Microsoft comenzará a estar disponible como vista previa pública, según anunció la compañía a través de Machine Learning Blog. La idea de este servicio es la de cerrar la brecha existente entre quienes buscan información entre los repositorios de datos de la propia empresa, quienes deben emplear más tiempo del necesario, y quienes lo producen. Como señala Joseph Sirosh, vicepresidente corporativo de Microsoft, en el citado blog, Azure Data Catalog es un servicio completamente gestionado que almacena, describe, indexa y proporciona información acerca de cómo acceder a cualquier fuente de datos que haya sido registrada.
Básicamente, aquellos usuarios que vayan a registrar las fuentes, usarán la herramienta de registro de fuentes de datos del servicio. El servicio, por su parte, extraerá los metadatos estructurales de las fuentes aportadas y lo llevará al catálogo basado en la nube, manteniendo las fuentes originales allí donde estén, ya sean en las instalaciones de la propia empresa o en la nube. Una vez hecho ésto, otros usuarios de la misma empresa pueden realizar búsquedas mediante diferentes técnicas para acceder a la información que necesita.
Acorde al anuncio, Azure Data Catalog alienta a la comunidad de productores de datos, consumidores de datos y expertos en datos para compartir sus conocimientos del negocio al tiempo que permite a las tecnologías de la información el mantener el control y supervisión de todas las fuentes de datos disponibles en sus sistemas de evolución constante.
Para conocer mejor el servicio, desde Microsoft han publicado un nuevo vídeo explicando al detalle su funcionamiento: