Big Data y futuro del almacenamiento

Blog colaborativo de: Valentina Pardo, Raúl González y Ricardo Toledo


¿Qué es Big Data y para qué sirve?

Big Data es el término que describe el gran volumen de datos, estructurados, semi-estructurados o no estructurados, ya que pueden ser imágenes, sonidos, datos de encuestas... A parte de esto, el Big Data es el análisis de estos datos para obtener ideas y con ellas tomar mejores decisiones.

El objetivo principal de Big Data es el de convertir los datos en información para facilitar la toma de decisiones (un ejemplo es el buscador de Google con su búsqueda predictiva, en tiempo real). Para las empresas además es muy útil para conocer el perfil de sus clientes y qué productos ofrecerles en base a sus decisiones tomadas anteriormente.

Las grandes empresas que llevan manejando una gran cantidad de datos han desarrollado “DataWarehouses” para tratar adecuadamente los datos que almacenan.


¿Qué diferencia hay entre una aplicación analítica y Big Data? Las 7Vs



Las empresas pioneras en Big Data lo definen con siete características, más conocidas como las 7Vs:

1.    Volumen: Big Data puede superar con creces la capacidad de un software analítico. El volumen está en continuo cambio, ya que el avance tecnológico hace que se puedan tratar datos que ocupen Terabytes o Petabytes.

2.    Variedad: Big Data incluye una gran cantidad de distintos tipos de datos diferentes a los que se han usado siempre de manera tradicional. Big Data puede analizar los mensajes de redes sociales, y así saber hábitos de vida, movimientos… mediante la explotación de sensores.

3.    Velocidad: La velocidad se refiere a la rapidez en que los datos son creados, almacenados y procesados en tiempo real. Hay procesos en los que es necesario el tiempo, por lo que deben estudiarse en tiempo real para que sean útiles para la empresa.

4.    Veracidad: La veracidad se refiere a la incertidumbre de los datos, es decir, la fiabilidad. Es necesario conseguir datos de calidad para eliminar datos imprevisibles que influyan en las decisiones de compra. Esta incertidumbre es un reto para el Big Data.

5.    Valor del dato: El dato no tiene valor. El dato obtiene valor cuando se puede tomar una decisión en base a la información extraída de los datos. Big Data trata de que a partir de la mayoría de los datos que se obtienen se pueda convertir en acción o decisión.

6.    Viabilidad: Las empresas analizan la información del mercado en el que trabajan. A través de esta información seleccionan los atributos y factores para predecir los resultados que más interesan a las empresas.

7.    Visualización del dato: La visualización se refiere al modo en que los datos son presentados, de una manera clara, sencilla y legible para que se puedan encontrar patrones a investigar.


Posible futuro del almacenamiento: ADN





          
Durante muchos años se ha intentado conseguir un sistema de almacenamiento mediante ADN. Ahora está un poco más cerca de cumplirse.

El cuerpo humano tiene unos 3,6 metros de ADN ultra dentro de casi todas nuestras células, de estas tenemos entre 20 hasta 100 billones. El ADN usa 4 bases para estructurar información, mediante la timina, guanina, citosina y adenina. Hasta ahora se ha conseguido traducir esto en bits, pero ha surgido otro problema, y es que los datos se leen y escriben muy lentamente, ya que el ADN son cadenas de datos sin secuencias y se tienen que leer de principio a fin sin capacidad de acceder a archivos intermedios. Pero ahora, se ha conseguido almacenar información en ADN con una densidad de 215 Petabytes por gramo utilizado.

Aún no se ha desarrollado (ni mucho menos), pero se han hecho grandes avances que posiblemente dentro de unos cuantos años traerán consigo muchos beneficios.

Bibliografía


Comentarios