Los 4 v de datos de gran

El consenso general del día es que hay atributos específicos que definen los grandes datos. En la mayoría de los círculos grandes volúmenes de datos, éstos se llaman los cuatro de V: volumen, variedad, velocidad y veracidad. (Es posible considerar una quinta V, valor).

Volumen

La principal característica que hace que los datos “grande” es el gran volumen. No tiene sentido centrarse en unidades mínimas de almacenamiento debido a que la cantidad total de información está creciendo exponencialmente cada año. En 2010, Thomson Reuters estimó en su informe anual que creía que el mundo era “inundado de más de 800 exabytes de datos y en crecimiento.”

Video: 30 Curiosidades de Drake & Josh | Cosas que quizás no sabías

Para ese mismo año, EMC, una compañía de hardware que hace que los dispositivos de almacenamiento de datos, pensó que estaba más cerca de 900 exabytes y crecería en un 50 por ciento cada año. En realidad, nadie sabe cuánto se está generando nuevos datos, pero la cantidad de información que se está recogido es enorme.

Variedad

La variedad es uno de los desarrollos más interesantes en la tecnología como más y más información se digitaliza. tipos de datos tradicionales (datos estructurados) incluyen cosas en un estado de cuenta como fecha, cantidad y tiempo. Estas son cosas que encajan perfectamente en una base de datos relacional.

Los datos estructurados se ve aumentada por los datos no estructurados, que es donde cosas como feeds de Twitter, archivos de audio, imágenes de resonancia magnética, páginas web, registros web se ponen - cualquier cosa que pueda ser capturado y almacenado, pero no tiene una meta modelo (Un conjunto de reglas para enmarcar un concepto o idea - que define una clase de la información y la forma de expresarlo) que define perfectamente.

Los datos no estructurados es un concepto fundamental en grandes volúmenes de datos. La mejor manera de entender los datos no estructurados es comparándolo con los datos estructurados. Pensar en datos estructurados como datos que está bien definido en un conjunto de reglas. Por ejemplo, el dinero siempre va a ser números y tener al menos dos nombres puntos- decimales se expresan como texto y fechas siguen un patrón específico.

Con los datos no estructurados, por el contrario, no hay reglas. Una imagen, una grabación de voz, un tweet - todos ellos pueden ser diferentes, pero expresar ideas y pensamientos sobre la base de la comprensión humana. Uno de los objetivos de grandes volúmenes de datos es usar la tecnología para tomar estos datos no estructurados y tener sentido de él.

La definición de grandes volúmenes de datos depende de si los datos pueden ser ingeridos, se procesan y se examinaron en un tiempo que cumple con los requisitos de una empresa en particular. Para una empresa o sistema, los datos pueden ser grandes 50TB- para otro, puede ser 10PB.

Video: 30 Curiosidades de Victorious | Cosas que quizás no sabías

Veracidad

La veracidad se refiere a la fiabilidad de los datos. ¿Puede el administrador de confiar en el hecho de que los datos son representativos? Todo buen gerente sabe que existen discrepancias inherentes en todos los datos recogidos.

Velocidad

Velocidad es la frecuencia de los datos de entrada que necesita ser procesada. Piense en la cantidad de mensajes SMS, actualizaciones de estado de Facebook, o lectores de tarjeta de crédito están siendo enviados en un portador de telecomunicaciones particular, cada minuto de cada día, y usted tendrá una buena apreciación de la velocidad. Una aplicación de streaming como Amazon Web Services Kinesis es un ejemplo de una aplicación que se encarga de la velocidad de datos.

Video: LOS 4 ► Tu De Que Vas (OFFICIAL VIDEO)

Valor

Puede parecer dolorosamente obvio para algunos, pero un objetivo real es fundamental para este mashup de los cuatro V de. Serán los puntos de vista que se reúnen a partir de análisis de crear una nueva línea de productos, una oportunidad de venta cruzada, o una medida de reducción de costos? ¿O los datos de análisis de plomo al descubrimiento de un efecto causal fundamental que da lugar a una cura para una enfermedad?

El objetivo final de cualquier proyecto de datos tan grande debe ser el de generar algún tipo de valor para la empresa que realiza todo el análisis. De lo contrario, sólo estás realizando alguna tarea tecnológica por la tecnología.

Artículos Relacionados