La modernización de almacenamiento de datos con hadoop

Video: Dispositivos de Almacenamiento de Información

Los almacenes de datos están ahora bajo estrés, tratando de hacer frente a una mayor demanda de sus recursos finitos. Hadoop puede proporcionar un alivio significativo en esta situación de almacenamiento de datos.

El rápido aumento de la cantidad de datos que se generan en el mundo tiene también almacenes de datos afectados debido a que los volúmenes de datos que manejamos están aumentando - en parte porque más estructurado los datos, el tipo de datos que es fuertemente tipado y embutidas en filas y columnas - se genera, sino también porque a menudo tienen que hacer frente a los requisitos regulatorios diseñados para mantener consultable acceso a los datos históricos.

Además, la potencia de procesamiento en los almacenes de datos se utiliza a menudo para llevar a cabo transformaciones de los datos relacionales, ya que o bien entra en el propio almacén o se carga en una mercado de datos niño (Un subconjunto separado del almacén de datos) para una aplicación de análisis específico.

Además, la necesidad es cada vez mayor para los analistas de la emisión de nuevas consultas en los datos estructurados almacenados en los almacenes, y estas consultas ad hoc a menudo puede utilizar muchos recursos de procesamiento de datos. A veces, un informe de una sola vez puede ser suficiente, ya veces un análisis exploratorio es necesario encontrar las preguntas que no han sido hasta ahora de que pidieron puede producir un significativo valor comercial.

La conclusión es que los almacenes de datos a menudo se utilizan para fines ajenos a su diseño original.

La figura muestra, utilizando arquitectura de alto nivel, cómo Hadoop puede vivir junto a los almacenes de datos y cumplir con algunos de los propósitos que no están diseñados.

Video: Guidance - Alternativas de almacenamiento

Hadoop es un almacén ayudante, no un reemplazo almacén. Hadoop puede modernizar un ecosistema de almacenamiento de datos en cuatro formas-aquí están en resumen:

  • Proporcionar una zona de aterrizaje para todos los datos.

    Video: Conferencia "Big Data, Architectures, Tools and Process"

  • Persistir los datos para proporcionar un archivo de datos consultable de frío.

    Video: Unidad De Almacenamiento Extraíble

  • A gran escala de las eficiencias de procesamiento por lotes apalancamiento de Hadoop para preprocesar y transformar los datos para el almacén.

  • Activar un entorno para el descubrimiento de datos ad hoc.

Artículos Relacionados