Pares de valores clave en el modelo de datos hbase

Video: Modelado de Datos: Entidades, Atributos, Clave Primaria, Clave Foránea y Relaciones

El modelo de datos HBase lógica es simple pero elegante, y proporciona un mecanismo de almacenamiento de datos natural para todo tipo de datos no estructurados - especialmente grandes conjuntos de datos. Todas las partes del modelo de datos convergen en un par clave-valor.

En primer lugar, en un mundo donde se puede pensar en la clave de fila como la clave principal para los datos almacenados en HBase, ¿cómo termina aprovechando el resto de los componentes del modelo de datos? Bueno, todo depende de la cantidad de datos que desea obtener en las consultas y cuánto tiempo está dispuesto a esperar.

Especificando sólo la clave fila potencialmente puede devolver un montón de datos, debido a una fila individual puede tener millones de columnas. Además, con sólo la clave fila para poder trabajar, HBase puede devolver todas las columnas de clasificación, la versión y valor relacionado con la tecla fila.

¿Qué pasa si desea que sólo una columna en particular o la versión de sus datos? Desde el ejemplo mostrado, se puede ver lo que sucede si desea que sólo el último nombre de un cliente en particular? La solución es construir una clave más compleja para especificar exactamente lo que necesita. Un par clave-valor puede tener este aspecto: rowKey: (Columna Familia: Columna Calificador: Version) = gt; Valor

Ver lógica de la información de contacto del cliente en HBase
fila claveColumna Familia: {Columna Calificador: Versión: Valor}
00001Nombre del cliente: {&lsquo-FN&rsquo-:
1383859182496:&lsquo-John&rsquo-,
&lsquo-LN&rsquo-: 1383859182858:&lsquo-Smith&rsquo-,
&lsquo-MN&rsquo-: 1383859183001:&rsquo-Timoteo&rsquo-,
&lsquo-MN&rsquo-: 1383859182915:&rsquo-T&rsquo-}
Datos de contacto: {&lsquo-EA&rsquo-:
1383859183030:[email protected]&rsquo-,
&rsquo-SA&rsquo-: 1383859183073:&rsquo-1 Hadoop Lane, NY
11111&rsquo-}
00002Nombre del cliente: {&lsquo-FN&rsquo-:
1383859183103:&lsquo-Jane&rsquo-,
&lsquo-LN&rsquo-: 1383859183163:&lsquo-Doe&rsquo-,
Datos de contacto: {
&rsquo-SA&rsquo-: 1383859185577:&rsquo-7 HBase Ave, CA
22222&rsquo-}

Después de especificar la clave, el resto es opcional. Cuanto más específico de hacer la consulta, sin embargo (que se mueve de izquierda a derecha), el más detallado de los resultados. Su rendimiento va a empeorar, debido a que el sistema tiene que pasar más tiempo para localizar el valor exacto o valores que necesita, pero menos datos se devuelven cuando se termina la consulta.

Así teclas son más complejas de lo que cabría imaginar a partir del estudio de la mesa. Por ejemplo, si desea que el segundo nombre más reciente (o el único nombre medio hasta ahora) del cliente en la fila ‘00001’, el par clave-valor resultante sería el siguiente: ‘00001: CustomerName: MN’ = gt; ‘Timoteo’

Recuerde que las versiones se implementan utilizando las marcas de tiempo de manera predeterminada y se clasifican en orden decreciente de manera que se obtiene automáticamente el valor más reciente si no se especifica una versión. Si quieres una inicial del segundo antes de su cliente (consulte la Tabla 12-2), su par de claves-valor resultante sería el siguiente:’00001: CustomerName: MN: 1383859182915 `= gt; ‘T’

Video: 11-Excel avanzado: Ordenar, filtrar y agrupar

Esperamos que las diversas descripciones de HBase están empezando a tomar forma en su mente. Específicamente, HBase es tanto una familia orientada almacén de datos de la columna y un almacén de datos-valor-par de claves. Refiriéndose a HBase como un simple almacén de datos “en columnas” deja mucho a la imaginación.

En caso de que estaban curioso, no hay tipos de datos en HBase - valores en HBase son sólo uno o más bytes. Una vez más, simple pero potente, ya que puede almacenar cualquier cosa!

Artículos Relacionados