Big Data es un término que describe el gran volumen de datos, estructurados y no estructurados, que inunda nuestra sociedad cada día. Pero lo importante no es la cantidad de datos, sino lo que se hace con ellos. Los Big Data, para que sirvan para algo, deben analizarse en busca de información valiosa que conduzca a mejores decisiones y a movimientos estratégicos.
El término Big Data se refiere a los datos informáticos que son tan grandes, rápidos o complejos que resulta difícil o imposible procesarlos con los métodos tradicionales. El acceso y mantenimiento de grandes cantidades de información para su análisis existe desde hace mucho tiempo. Pero el concepto de Big Data no cobró fuerza hasta principios de la década de los 2000, cuando el analista de mercado Doug Laney articuló la definición actual de Big Data como las tres V:
- VOLUMEN
Las organizaciones recopilan datos de diversas fuentes, como transacciones empresariales, dispositivos inteligentes (IoT), equipos industriales, vídeo, redes sociales y mucho más. En el pasado, los costes de almacenamiento habrían sido un problema, pero hoy en día son mucho más asequibles, gracias a plataformas como los lagos de datos.
- VELOCIDAD
Con el crecimiento del Internet de las Cosas, los flujos de datos deben gestionarse a tiempo y a una velocidad sin precedentes. Las etiquetas RFID, los sensores y los contadores inteligentes han traído consigo la necesidad de gestionar estos ríos de datos prácticamente en tiempo real.
- VARIEDAD
Los datos están disponibles en todo tipo de formatos, desde datos estructurados y numéricos en bases de datos tradicionales hasta documentos de texto no estructurados, correo electrónico, vídeo, audio, datos bursátiles y transacciones financieras.
Además, es necesario tener en cuenta dos dimensiones adicionales al tratar con Big Data:
- VARIABILIDAD
Además de crecer en velocidad y variedad, los flujos de datos son impredecibles, por lo que cambian a menudo y varían constantemente. Son el verdadero reto para todas aquellas empresas que necesitan saber cuándo algo es tendencia en las redes sociales y cómo gestionar los picos de datos diarios, estacionales o basados en eventos.
- VERACIDAD
La veracidad se refiere a la calidad de los datos. Como los datos proceden de tantas fuentes distintas, es difícil vincularlos, cotejarlos, limpiarlos y transformarlos entre sistemas. Se necesita vincular y correlacionar las relaciones, jerarquías y conexiones entre los datos. De lo contrario, podrían descontrolarse rápidamente.
El Big Data es uno de los desarrollos más profundos y omnipresentes del mundo digital
Esta tendencia está destinada a permanecer y afectar profundamente a nuestras vidas, pero no sólo eso. También está destinada a afectar a nuestra forma de hacer negocios.