Definición de datos grandes por sus cuatro vs.

Cuatro características (los cuatro Vs) Definen grande de datos: el volumen, la velocidad, la variedad y valor. big Data son datos que supera la capacidad de procesamiento de los sistemas de bases de datos convencionales porque es demasiado grande, se mueve demasiado rápido, o no se ajusta a los requisitos estructurales de las arquitecturas de bases de datos tradicionales. Si los volúmenes de datos rango en la escala de terabytes o petabytes, soluciones de ingeniería de datos deben ser diseñados para satisfacer los requisitos de los datos del destino y uso previsto.

Cuando estás hablando de datos regular, es muy probable que escuchar las palabras kilobyte o gigabyte utilizado - 103 y 109 bytes, respectivamente. Por el contrario, cuando se está hablando de grandes volúmenes de datos, palabras como terabyte y petabyte son arrojados alrededor de - 1012 y 1015 bytes, respectivamente. UN byte es una unidad de 8 bits de datos.

Desde los cuatro Vs de grandes volúmenes de datos están creciendo continuamente, y más innovadoras tecnologías de datos nuevos continuamente se deben desarrollar para gestionar grandes problemas de datos.

Cada vez que usted está en duda, utilice los criterios 4V para determinar si usted tiene un gran-de datos o problemas de datos regular en sus manos.

Grappling con volumen de datos

Los límites inferiores de grandes volúmenes de datos oscilan entre unos pocos terabytes, hasta decenas de petabytes, sobre una base anual. Los números de volumen por el cual se define un conjunto de datos grande no tienen ningún límite superior. De hecho, los volúmenes de la mayoría de los conjuntos de datos grandes están aumentando exponencialmente sobre una base anual.

Video: Samsung Galaxy S4 review (en español)

Manejo de la velocidad de datos

maquinaria y sensores automatizada están generando datos de alta velocidad sobre una base continua. En términos de ingeniería, la velocidad de datos es el volumen de datos por unidad de tiempo. velocidades de datos amplia gama en cualquier lugar entre 30 kilobytes (K) por segundo hasta incluso 30 gigabytes (GB) por segundo. De alta velocidad, los flujos de datos en tiempo real presenta un obstáculo para la toma de decisiones oportuna. Las capacidades de las tecnologías de manejo de datos y de procesamiento de datos a menudo limitan las velocidades de datos.

Video: René Descartes - Filosofía - Educatina

Tratar con variedad de datos

grandes volúmenes de datos hace que todo sea más complicado mediante la adición de los datos no estructurados y semi-estructurados con los conjuntos de datos estructurados. Se llama alto-variedad datos. fuentes de datos de alta variedad se pueden derivar de los flujos de datos que se generan a partir de las redes sociales o de maquinaria automatizada.

Video: LA GRAN PELEA 4: BOYKA | Trailer ESPAÑOL HD (2017) | INVICTO 4 Película

Datos estructurados es datos que pueden ser almacenados, procesados, y se manipula en un sistema tradicional de gestión de base de datos relacional. Estos datos pueden ser generados por los seres humanos o máquinas, y se deriva de todo tipo de fuentes, de click-corrientes y formas basadas en web para transacciones de punto de venta y sensores.

Los datos no estructurados viene completamente desestructurada - comúnmente se genera a partir de las actividades humanas y no encaja en un formato de base de datos estructurada. Tales datos podrían derivarse de blogs, correos electrónicos y documentos de Word.

datos Semi-estructurada son datos que no encaja en un sistema de base de datos estructurada, no obstante, esté estructurado por las etiquetas que son útiles para la creación de una forma de orden y la jerarquía en los datos. los datos semi-estructurados se encuentra comúnmente en los sistemas de bases de datos y archivos. Se puede almacenarse como archivos de registro, archivos XML, o archivos de datos JSON.

La creación de valor de datos

En su forma más cruda, datos más grande es bajo valor - en otras palabras, la relación cantidad-valor a los datos es baja en grandes volúmenes de datos en bruto. grandes volúmenes de datos se compone de un gran número de transacciones muy pequeñas que vienen en una variedad de formatos. Estos componentes incrementales de datos grandes producen cierto valor sólo después de que se enrollan y se analizaron. ingenieros de datos tienen la tarea de enrollarla y científicos de datos tienen la tarea de analizarlo.

Artículos Relacionados