¿Cuántas Vs tiene tu Modelo ideal en Big Data?
Cuando se define los modelos de Big Data se habla de las Vs, que son elementos fundamentales que caracterizan al Big Data de otros sistemas de información.
Dependiendo de la fuente se define un número diferente de dimensiones: 3 V, 4 V, 5 V o incluso 6 V. Las grandes empresas consultoras coinciden en tresdimensiones (volumen, velocidad y variedad) conocido como «Modelo de las 3 Vs». A estas tres dimensiones IBM añade una dimensión mas veracidad, construyendo así su modelo de las 4 Vs. Otras fuentes añaden una quinta dimensión, valor. Y en los últimos años, se añade una sexta dimensión, variabilidad.
Volumen
Como se ha indicado en los posts anteriores sobre Big Data, diariamente se generan grandes volúmenes de datos, considerando hoy en día estas grandes cantidades de datos como normales. IBM da el dato de 12 terabytes para el volumen que crea Twitter cada día solo en el análisis de productos para mejorar en la eficacia.
Este gran volumen de datos es una de las consecuencias en las mejoras de las redes de comunicaciones y de las mayores velocidades de los accesos de banda ancha, pero la mayor cantidad de datos por sí sola no aporta valor sino se tiene en cuenta las otras dimensiones.
Velocidad
En muchas organizaciones es importante disponer de información en tan solo 5 minutos, como puede ser las operaciones contra el fraude o la generación de datos sobre epidemias, en las que es necesario actuar de forma rápida. En todos estos casos el procesamiento y análisis de los datos se debe realizar en tiempo real. Además, esta información caduca rápidamente quedando obsoletos dichos datos. Por lo tanto, la velocidad se refiere a los datos en movimiento.
Variedad
Un aspecto fundamental de Big Data es la diversidad o variedad de datos que se pueden utilizar. Los datos pueden ser de cualquier tipo (bases de datos estructuradas, vídeos, archivos logs, audios, datos de redes sociales, imágenes, etc.). Toda esta variedad de datos se analiza de manera conjunta, y con nuevas técnicas.
Veracidad
Esta cuarta dimensión utilizada por IBM la define a partir del siguiente dato: «Uno de cada tres directivos no se fía de los datos que utilizan para su toma de decisiones». Por lo tanto, el uso de esta dimensión es fundamental como medida de fiabilidad de la información extraída de Big Data.
Valor
Las organizaciones estudian obtener información de los grandes datos de una manera rentable y eficiente. Es imprescindible generar valor de negocio con los datos que nos proporciona el Big Data.
Variabilidad
Los datos se generan de manera rápida y quedan obsoletos en muy poco tiempo, pero el tipo de datos y hasta el propio diseño o modelo creado para Big Data puede modificarse a corto plazo. Por tanto, el introducir esta nueva dimensión para considerar los cambios en la estructura del modelo es totalmente necesaria.
¿Con cuántas V s construirás tu modelo de Big Data? ¿Añadirías alguna otra nueva V?
Modelo 3Vs
Las 10 «V» del Big Data y hasta las 5 «R». Qué difícil es consensuar entre vendedores y gente con mucha «inspiración». http://www.datasciencecentral.com/profiles/blogs/top-10-list-the-v-s-of-big-data
Me gustaMe gusta
Muy buena aportación Luis! Interesante sin duda y buen debate.
Me gustaMe gusta