Big Data está cada vez más en boca de todos, pero no es algo nuevo, ni es algo que la gente entienda completamente.
Para aclarar algunos puntos sobre el tema hemos hablado con Sandeep Arora, quien ha trabajado con servicios en la nube, Ingeniería de datos y DevOps. Ha pasado los últimos siete años evangelizando desde un rol en la administración de bases de datos hasta tratar de automatizar todo utilizando PowerShell para hacer algunas cosas en DevOps y convertirse en un arquitecto de soluciones en AWS, Azure y GCP.
Le vimos recientemente en Data Ops, donde nos contestó algunas preguntas:
¿Qué es Big Data?
Big Data es una colección de conjuntos de datos múltiples con diferentes formatos y no es necesario que sean masivos para ser categorizados como Big Data, lo cual es una suposición común. Big data es algo que la mayoría de las empresas no saben cómo recopilar y las empresas que recopilan esa información no saben qué hacer con esa información. Es una mina de oro que si se extrae (analiza) adecuadamente puede ser muy útil para el negocio.
Big Data, AI, Machine Learning … ¿todo esto es realmente nuevo?
De ningún modo. Los grandes datos se remontan a los tiempos en que realmente comenzamos a recopilar datos. Es solo que ahora tenemos nombres sofisticados y mejores herramientas para definir, recopilar y analizar toda esa información.
¿Cómo empezaste a trabajar en el mundo del Big Data?
Comencé mi carrera como administrador de base de datos y luego pasé al diseño de la nube y, cuando estaba aprendiendo Google Cloud Platform, me di cuenta de lo importante que era administrar y manejar diferentes tipos de datos. Todavía creo que estoy en las etapas más tempranas de este viaje para aprender e implementar el análisis de datos porque hay mucho que aprender y mucho menos tiempo para dominarlo todo.
¿Cómo están los grandes datos cambiando nuestras vidas?
Está en todas partes, desde las ventanas emergentes de anuncios de comercio electrónico más molestas hasta el uso de una aplicación móvil para obtener información de tráfico o cualquier otra información útil. Big Data ha mejorado la experiencia de compra del cliente, viajes, servicios de salud, juegos, etc. y está evolucionando continuamente con más aplicaciones de la vida real para mejorar la experiencia humana.
¿Qué recomienda a un estudiante de computación que quiera ser un experto en Big Data?
Debes conocer Python si quieres dedicarte a la ciencia de la información y al campo del big data. Lo primero que recomendaría a un estudiante es que se centren en aprender Python. Hay algunos cursos asombrosos en Linuxacademy.com que pueden ayudarlo a ponerse al día con Hadoop y otros elementos de big data, y antes se dará cuenta de que debe saber Python si tiene la intención de progresar en este campo. Por lo tanto, recomendaría comenzar con eso, luego utilizar muchas fuentes gratuitas en línea que lo pondrán al día y luego tomar cursos más orientados al trabajo de sitios como Linuxacademy.com (altamente recomendado).
¡Gracias a Sandeep por su tiempo!