Big Data por el Prof. Dr. D. José María Ruiz Gómez, académico de número

La llegada del ordenador representó un avance muy importante en el estudio y análisis de grandes conjuntos de datos, estructurados a través de distintas técnicas estadísticas multivariantes. Sin embargo, el nacimiento de internet ha dado lugar a un mundo totalmente conectado, con la generación de ingentes cantidades  de datos que siguen aumentando en el tiempo de forma exponencial. Además, la naturaleza de esta información es diferente a la anterior, pues la mayoría de estos datos son de tipo semiestructurado o no estructurados, ya que su procedencia corresponde a dispositivos móviles, correos electrónicos, vídeos, audios, imágenes, escáneres, sistemas GPS, etc. El tratamiento de ellos no podría hacerse con las tecnologías existentes y para el estudio de estas grandes cantidades de datos de distinto tipo, surge el Big Data.

Las preguntas que nos hacemos, entre otras, son: ¿Qué es el Big Data y por qué es tan importante?  y ¿Cuáles son sus características?

El concepto de Big Data surge entonces para cubrir las necesidades no satisfechas con las tecnologías tradicionales y consiste en técnicas algorítmicas que combinan, entre otros, modelos predictivos, matemáticas e inteligencia artificial.  Entre sus objetivos están no solo almacenar y procesar datos, sino también recibir datos y evaluarlos en tiempo real, encontrar patrones repetitivos de comportamiento de esos datos y seleccionar nuevos modelos de predicción a partir de ellos, es decir, obtener todo el conocimiento contenido en los datos de forma ágil y veloz y, así, poder mejorar la toma de decisiones en las diversas organizaciones públicas o privadas.

Las características del Big Data están resumidas en las tres uves. Volumen: capacidad para trabajar con ingentes cantidades de datos de distinta Variedad: datos estructurados, semiestructurados y no estructurados; y por último, Velocidad: el estudio tiene sentido si los datos se obtienen y se tratan en tiempo real, para poder dar respuestas inmediatas al problema planteado. Otras dos uves de interés son la comprobación de la Veracidad y del Valor de los datos.

La utilización de esta técnica es ya una característica de éxito y que marca diferencias, tanto en las grandes empresas como en las pymes. En varias universidades españolas existen grados y másteres sobre este tema. En nuestra región, el próximo curso 2022-23 se implantará el grado en Ciencia e Ingeniería de  Datos en las Universidades de Murcia y Cartagena, y seguro que alcanzará un gran éxito, ya que existe una gran demanda de profesionales con esta formación.

Las respuestas a otras preguntas como: ¿Sólo tiene ventajas? o ¿Qué problemas resuelve?, se expondrán en una próxima columna.