El masterserver hbase

A partir de un análisis de la arquitectura HBase (Base de datos Hadoop) describiendo RegionServers en lugar de la MasterServer puede sorprender. El termino RegionServer parecería implicar que depende de (y es secundaria a) la MasterServer y que, por tanto, debe tratar el MasterServer primero. Como dice la vieja canción, sin embargo, “no es necesariamente así.”

Video: BigTable

Los RegionServers no dependen de la MasterServer para ciertas funciones, pero no en el sentido de una relación maestro-esclavo para el almacenamiento y recuperación de datos. En la esquina superior izquierda de la figura, observe que los clientes no apuntan a la MasterServer, pero apuntan en cambio a la agrupación y RegionServers Zookeeper.

El MasterServer no está en la ruta de acceso para el almacenamiento de datos y acceso - ese es el trabajo de la agrupación Zookeeper y los RegionServers. Echar un vistazo a las principales funciones del MasterServer, que es también un proceso de software (o demonio) como los RegionServers. El MasterServer está ahí para

  • Monitorear los RegionServers del clúster HBase: El MasterServer mantiene una lista de RegionServers activo del clúster HBase.

  • Manejar las operaciones de metadatos: Cuando se crea una tabla o se alteran sus atributos (ajuste de compresión, la configuración de caché, control de versiones, y más) la MasterServer se encarga de la operación y almacena los metadatos necesarios.

  • Asignar regiones: El MasterServer asigna a regiones RegionServers.

  • Manejo de RegionServer conmutación por error: Al igual que con cualquier grupo distribuido, se espera que los fallos de nodo no se producen y planear para ellos de todos modos. Cuando los servidores región fallan, Zookeeper notifica al MasterServer para que las operaciones de conmutación por error y restaurar se pueden iniciar.

  • Supervisar el equilibrio de carga de las regiones a través de todos RegionServers disponibles: Usted puede recordar que las tablas se componen de regiones que se distribuyen de forma homogénea en todos los RegionServers disponibles. Este es el trabajo de la rosca equilibrador (o faena, si se prefiere), que la MasterServer activa periódicamente.

  • Gestionar (y limpiar) tablas de catálogo: Dos tablas de catálogo clave son utilizados por el sistema de HBase para ayudar a un cliente a encontrar un par de valores clave particular en el sistema.

    El MasterServer proporciona una gestión de estas tablas críticos en nombre de todo el sistema HBase.

  • Desactive la WAL: El MasterServer interactúa con la conmutación por error WAL durante RegionServer y limpia periódicamente los registros.

  • Proporcionar un marco coprocesador para la observación de operaciones de maestro: Aquí hay otro nuevo término para su crecimiento glosario HBase. coprocesadores ejecutarse en el contexto de la MasterServer o RegionServers. Por ejemplo, un observador coprocesador MasterServer le permite cambiar o ampliar la funcionalidad normal del servidor cuando operaciones como la creación de la tabla o la supresión de mesa tienen lugar. A menudo se utilizan coprocesadores para gestionar índices de las tablas para aplicaciones HBase avanzado.

Un coprocesador, que se ejecuta en el contexto de la MasterServer y o RegionServer (o ambos) se puede utilizar para mejorar la seguridad, crear índices secundarios, y más. Puede encontrar más información sobre los coprocesadores en una HBase blog de la comunidad.

Al igual que con todas las tecnologías de Hadoop de código abierto, las operaciones MasterServer es probable que cambie con el tiempo como la comunidad de ingenieros trabajan en las innovaciones diseñadas para mejorar HBase. Al escribir estas líneas, sin embargo, ahora tiene una lista bastante completa que sirve como referencia de alto nivel para la MasterServer.

Por último, un punto más importante sobre la calidad del HBase MasterServer: No puede y debe ser un MasterServer copia de seguridad en cualquier grupo HBase. Es necesario que haya un solo MasterServer activa en un momento dado, por lo que el MasterServer copia de seguridad es para fines de conmutación por error.

Usted puede recordar que el MasterServer no está en la ruta de acceso a datos para los clientes HBase. Sin embargo, también se puede recordar que el MasterServer es responsable de acciones tales como la conmutación por error RegionServer y balanceo de carga. La buena noticia es que los clientes pueden seguir para consultar el cluster HBase si el maestro se cae pero para las operaciones de clúster normales, el maestro no debe mantenerse hacia abajo durante cualquier periodo de tiempo.

Artículos Relacionados