Regionservers en hbase

Video: HBase Regions and HBase RegionServers

RegionServers son los procesos de software (a menudo llamados demonios) se activan para almacenar y recuperar datos en HBase (Base de datos Hadoop). En los entornos de producción, cada RegionServer se implementa en su propio nodo de cómputo dedicado. Cuando empiece a usar HBase, se crea una tabla y luego comenzar a almacenar y recuperar sus datos.

Video: HBase Hot Spot Detection and Resolution

Sin embargo, en algún momento - y tal vez bastante rápido en los grandes casos de uso de los datos - la tabla crece más allá de un límite configurable. En este punto, el sistema HBase divide automáticamente la mesa y distribuye la carga a otro RegionServer.

En este proceso, a menudo referido como auto-sharding, HBase escala automáticamente a medida que agrega datos al sistema - una gran ventaja en comparación con la mayoría de los sistemas de gestión de bases de datos, que requieren la intervención manual para escalar el sistema global más allá de un único servidor. Con HBase, siempre y cuando usted tiene en el bastidor otro servidor de repuesto que está configurado, de escala es automático!

Video: hbase install on hadoop (ecosystem) *Linux Centos

¿Por qué establecer un límite en las tablas y luego dividirlos? Después de todo, el HDFS es el mecanismo subyacente de almacenamiento, por lo que todos los discos disponibles en el cluster HDFS están disponibles para el almacenamiento de las tablas. (Sin contar el factor de replicación, por supuesto.) Si tiene un clúster completo a su disposición, ¿por qué limitarse a una RegionServer para administrar sus tablas?

Sencillo. Usted puede tener cualquier número de tablas grandes o pequeños y usted quiere HBase para aprovechar todas las RegionServers disponibles en la gestión de sus datos. ¿Quieres aprovechar al máximo el rendimiento de cómputo de la agrupación. Por otra parte, con muchos clientes que acceden al sistema de HBase, tendrá que utilizar muchos RegionServers para satisfacer la demanda.

Video: Hadoop. NoSQL, HBase, Cassandra

HBase aborda todas estas preocupaciones para usted y escala automáticamente en términos de capacidad de almacenamiento y potencia de cálculo.

Artículos Relacionados