Los atributos de hbase

Video: Josue Yrion - Los Atributos De DIOS - Prédicas Cristianas

HBase (Base de datos Hadoop) es una implementación de Java de BigTable de Google. Google BigTable define como un “distribuido escasa mapa, y persistente multidimensional ordenada.” Es toda una definición concisa, pero también estará de acuerdo en que es un poco en el lado complejo. Para descomponer la complejidad de BigTable un poco, siguiente es una descripción de cada atributo.

Hbase es escasa

Como es de suponer, la BigTable distribuido sistema de almacenamiento de datos fue diseñado para satisfacer las demandas de grandes volúmenes de datos. Ahora, las aplicaciones de datos grandes almacenar gran cantidad de datos, pero gran contenido de datos también es a menudo variable. Imagine una mesa tradicional en una información de contacto al cliente almacenar la base de datos de la empresa, como se muestra:

Tradicional del cliente Contacto Tabla de Información
Identificación del clienteApellidoNombre de pilaSegundo nombreDirección de correo electrónicoDirección
00001HerreroJohnTimoteo1 Hadoop Lane, NY 11111
00002GamaJaneNULONULO7 HBase Ave, CA 22222

Una empresa o individuo puede requerir un registro completo de datos para cada uno de sus clientes o participantes. Un buen ejemplo es su médico, quien necesita toda su información de contacto con el fin de proporcionarle la atención adecuada. Otras compañías o individuos pueden requerir información de contacto sólo parcial o pueden necesitar para aprender que la información en el tiempo.

Por ejemplo, una empresa de servicio al cliente puede procesar llamadas telefónicas o mensajes de correo electrónico para solicitudes de servicio. Los clientes pueden o no optar por dar las empresas de servicios toda su información de contacto. Sin embargo, con cada interacción con el tiempo, las empresas pueden obtener más información sobre sus clientes que les permitan ofrecer un mejor servicio - mediante la emisión de alertas proactivas de servicio, por ejemplo.

En este contexto, escaso significa que los campos en filas pueden estar vacíos o NULL, pero que no trae HBase a un alto. HBase puede manejar el hecho de que no lo hace (todavía) no conoce el nombre y dirección de correo electrónico medio de Jane Doe, por ejemplo.

He aquí otro ejemplo: una base de datos para almacenar las imágenes de satélite. Resulta que Google utiliza la tecnología de BigTable para almacenar las imágenes de satélite de la tierra. En casi todos los casos, siempre que se almacena imágenes, metadatos también se almacena con él.

Los metadatos pueden incluir la dirección de la calle de la imagen o solamente la latitud y longitud si la imagen es capturada desde el desierto. Los metadatos es variable en el contenido de lo que algunos campos serán nulos - y eso está bien.

En ambos ejemplos, los conjuntos de datos que son recogidos pueden ser extremadamente grandes - sobre todo en el segundo ejemplo. bases de datos de imágenes son casi siempre se miden en terabytes o petabytes en ocasiones.

HBase está diseñado para almacenar grandes volúmenes de datos, pero también está diseñado para almacenar registros de datos dispersos, sin costo alguno. Esta preocupación es crucial cuando se está utilizando aplicaciones de datos grandes! El almacenamiento de unos pocos registros NULL más de un millón de filas es un despilfarro, pero trate de imaginar los residuos más de mil billones de filas!

Afortunadamente, esto era una consideración clave para los diseñadores de Google y la comunidad HBase. escasez de datos es compatible con ninguna pérdida de espacio de almacenamiento costoso.

Y no se detiene allí. Considere el poder de un almacén de datos sin esquema. La tabla que muestra una tabla de contacto con el cliente clásico. Cuando las compañías diseñan estas tablas, saben por adelantado lo que quiere almacenar. En otras palabras, el esquema es fijo- Se define incluso antes del primer byte de información se almacena en la tabla.

Ahora lo que si, con el tiempo, se necesita un nuevo campo para un cliente? ¿Qué tal un mango Twitter o un nuevo número de teléfono móvil? Estás aparentemente atascado con un esquema que ya no funciona para usted.

Bueno, HBase resuelve este reto también - no sólo se puede omitir campos sin costo cuando no se dispone de los datos, sino también añadir dinámicamente campos (o columnas en la lengua vernácula HBase) con el tiempo sin tener que rediseñar el esquema o interrumpir las operaciones.

Video: AudioLibro - Los atributos de Dios (Arthur W. Pink)

Así que usted puede pensar en HBase como una tienda-datos sin esquema, es decir, que es fluida - se puede añadir, quitar o modificar el esquema a medida que avanza.

HBase se distribuye y persistente

BigTable es un sistema de archivos distribuido y persistente. Persistente Simplemente significa que los datos se almacenan en BigTable (y HBase, para el caso) va a persistir o permanecer después de que termine su programa o sesión. Eso es bastante sencillo - persistente significa que persiste - pero debe pasar un poco más tiempo pensando cómo los datos se persistió.

Video: LOS ATRIBUTOS DE DIOS

En su documento de BigTable, Google se describe el sistema de archivos distribuido conocido como Sistema de Archivo o Google GFS. Resulta que, al igual que HBase es una implementación de código abierto de BigTable, HDFS es una implementación de código abierto de GFS.

Por defecto, HBase aprovecha HDFS a persistir sus datos para almacenamiento en disco. Aunque otros almacenes de datos distribuidos se pueden utilizar con HBase, la gran mayoría de HBase HDFS instalaciones apalancamiento. Esto tiene mucho sentido dado que HBase es la “Base de datos Hadoop” - Oye, está integrado en el nombre, por amor de Dios.

HDFS es una tecnología clave no sólo para Hadoop, sino también para HBase. Mediante el almacenamiento de datos en HDFS, HBase ofrece fiabilidad, disponibilidad, escalabilidad transparente, alto rendimiento y mucho más - todo en el precio de los servidores distribuidos eficaces!

HBase tiene un mapa multidimensional ordenados

A partir de los conceptos básicos, una mapa (También conocido como una matriz asociativa) Es una colección abstracta de pares de valores clave, donde la clave es única. Esta definición es crucial para la comprensión de HBase debido a que el modelo de datos HBase se describe a menudo en diferentes formas - a menudo de forma incompleta como una tienda orientada a columnas.

Video: Definir atributos de bloques.© UPV

HBase es, en el fondo, un almacén de datos clave-valor, donde cada tecla es único - lo que significa que aparece como máximo una vez en el almacén de datos HBase. Además, el mapa está ordenada y multidimensional. Las claves se almacenan en HBase y ordenados en orden lexicográfico de bytes. Cada valor puede tener múltiples versiones, lo que hace el modelo de datos multidimensional. De manera predeterminada, las versiones de datos se implementan con una marca de tiempo.

Artículos Relacionados