¿Cómo elegir una arquitectura de cluster Hadoop

Video: Hadoop - Introducción

Hadoop está diseñado para ser implementado en un gran grupo de ordenadores conectados en red, con nodos maestros (que albergan los servicios que controlan el almacenamiento y procesamiento de Hadoop) y nodos esclavos (donde se almacena y procesa los datos). Puede, sin embargo, ejecutar Hadoop en un solo equipo, lo cual es una gran manera de aprender los conceptos básicos de Hadoop mediante la experimentación en un espacio controlado.

Hadoop tiene dos modos de despliegue: modo pseudo-distribuida y modalidad completamente distribuida, ambos de los cuales se describen aquí.

modo Pseudo-distribuido (solo nodo)

Un despliegue Hadoop de un único nodo se conoce como funcionamiento Hadoop en pseudo-distribuido de modo, donde todos los servicios de Hadoop, incluyendo los servicios de maestro y esclavo, todos se ejecutan en un único nodo de cómputo. Este tipo de implementación es útil para probar rápidamente aplicaciones, mientras que los está desarrollando sin tener que preocuparse sobre el uso de los recursos del clúster Hadoop otra persona podría necesitar.

Video: Clúster de alto rendimiento: Prueba de renderizado de imagenes y videos con Blender

Es también una manera conveniente para experimentar con Hadoop, como la mayoría de nosotros no tienen grupos de computadoras a nuestra disposición.

modalidad completamente distribuida (un grupo de nodos)

Un despliegue de Hadoop, donde los servicios de maestro y esclavo de Hadoop se ejecutan en un conjunto de ordenadores se ejecuta en lo que se conoce como modalidad completamente distribuida. Se trata de un modo apropiado para zonas de actividades productivas y clusters de desarrollo. Otra distinción se puede hacer aquí: una desarrollo de aglomeraciones por lo general tiene un pequeño número de nodos y se utiliza para crear prototipos de las cargas de trabajo que eventualmente se ejecutarán en una clúster de producción.