Imagina la cantidad de datos que se registran cada vez que realizas una transacción online (montos, fechas, usuarios, cuentas, saldos, intereses, comisiones, tasas de cambio inmediatas, etc.), multiplícalo por la cantidad de veces que las llevas a cabo durante el mes y, una vez más, multiplica el resultado por los cientos de miles de clientes que puede tener tu banco.
Más ejemplos
Ahora, piensa en los registros de estado físico de una persona que con los dispositivos móviles y prendas inteligentes son obtenidos por segundo, y multiplica sucesivamente, incluyendo la cantidad de modelos de dispositivos presentes en el mercado, hasta llegar al número de mediciones que podrían registrarse con los habitantes de una ciudad en apenas una semana o en quince días.
Finalmente, considera toda la información recogida por Facebook y Twitter en una pequeña región y en un intervalo de tiempo de solo un día: fechas, textos (cantidad de palabras, hashtags, enlaces, emoticones, etc.), contenidos multimedia, datos técnicos de los móviles en los que funcionan sus apps, interacciones, coordenadas geográficas, publicaciones revisadas entre usuarios, etc.
Big data y Data Science
Los volúmenes de datos son exorbitantes, son Big Data, y continúan en aumento cada instante, particularmente, porque los ejemplos de la vida real tienen en cuenta segmentos de tiempo también extensos y con registros mantenidos de forma continua, tanto como es necesario su tratamiento y análisis.
Y, hasta que lo anterior no sucede, las organizaciones se mantienen en situación de incertidumbre. Mejor dicho, no son pocas las entidades públicas y empresas privadas que consiguen tan grandes cantidades de información pero no pueden obtener el suficiente valor de ellas por falta de infraestructura y personal capacitado en áreas del conocimiento desarrolladas recientemente para explotarlas.
Claramente, esto conlleva a una amplia demanda de profesionales -bien pagados- que puedan brindar a tales entidades la guía suficiente para adaptarse al constante y gigantesco flujo de datos, pero para ello, el profesional debe tener consolidado un arsenal de herramientas matemáticas, de análisis estadístico ”“con un amplio componente en la visualización de la información- y de computación de vanguardia ya que los métodos convencionales no son suficientes para tan compleja labor, especialmente, porque fueron concebidos para otros menesteres.
Cursos de Big Data y Data Science
Por fortuna la ciencia de datos actual (Data Science) brinda más que lo necesario para lidiar con ello, y sus enseñanzas están al alcance de cualquiera así como otras áreas han logrado llevar sus novedades al mundo entero.
En esta ocasión, nos hablan desde la U-tad sobre un nuevo par de postgrados que andan impartiendo y que se muestran estrechamente relacionados con el manejo de grandes volúmenes de datos.
El primero titula Máster Telefónica Big Data & Analytics y se enfoca en dotar a jóvenes ingenieros con lo suficiente para comprender temas como los sistemas de ficheros HDFS y las bases teóricas de un data scientist, el manejo de bases de datos no relacionales, el trabajo de visualización interactiva de Big Data, el conocimiento de Business Intelligence o Inteligencia de negocio en tales volúmenes de datos y, en general, la abstracción de conocimiento en diferentes entidades y con bases de datos distribuidas.
La otra opción, con un componente mucho más técnico, es referenciada como Experto en Data Science y su área de acción está “en el campo del análisis de datos (Data Analytics) en los nuevos entornos de Big and Small Data Business Intelligence.” Manejo de Hadoop, Storm y Spark, análisis de datos avanzado con R y RStudio (con librerías especiales), programación en Python, entornos NoSQL, técnicas de aprendizaje automático (Machine Learning) y hasta aspectos legales y regulatorios en la captura y tratamiento de datos se incluyen en las competencias de su pensum.
En fin, no sobra la invitación para empaparse sobre tan importante nuevo espacio de desenvolvimiento que busca al mundo profesional ”“y al académico, pues la investigación es enorme- para aprovechar esta ingente mina de información.