¿Cómo elegir una arquitectura de clúster Hadoop

Hadoop está diseñado para ser desplegado en un gran grupo de ordenadores conectados en red, con nodos maestros (que albergan los servicios que controlan el almacenamiento de Hadoop y procesamiento) y nodos esclavos (donde se almacena o trata los datos). Puede, sin embargo, ejecute Hadoop en un solo equipo, lo cual es una gran manera de aprender los fundamentos de Hadoop mediante la experimentación en un espacio controlado.

Hadoop tiene dos modos: el modo de implementación de pseudo-distribuida y modalidad completamente distribuida, ambos de los cuales se describen aquí.

Modo Pseudo-distribuida (un solo nodo)

Un despliegue Hadoop de nodo único se conoce como correr en Hadoop pseudo-distribuido modo, en todos los servicios de Hadoop, incluidos los servicios de maestro y esclavo, todos se ejecutan en un único nodo de cómputo. Este tipo de despliegue es útil para probar rápidamente aplicaciones mientras usted los está desarrollando sin tener que preocuparse sobre el uso de los recursos del clúster Hadoop otra persona podría necesitar.

También es una forma cómoda de experimentar con Hadoop, como la mayoría de nosotros no tiene grupos de computadoras a nuestra disposición.

Modo totalmente distribuida (un conjunto de nodos)

Un despliegue Hadoop, donde los servicios de maestro y esclavo Hadoop ejecutan en un clúster de computadoras se está ejecutando en lo que se conoce como modalidad completamente distribuida. Este es un modo apropiado para aglomeraciones productivas y clusters de desarrollo. Otra distinción se puede hacer aquí: un agrupación de desarrollo por lo general tiene un pequeño número de nodos y se utiliza para crear prototipos de las cargas de trabajo que finalmente se ejecutarán en un clúster de producción.




» » » » ¿Cómo elegir una arquitectura de clúster Hadoop