Regionservers en HBase

RegionServers son los procesos de software (a menudo llamados demonios) que activan para almacenar y recuperar datos en HBase (Hadoop base de datos). En entornos de producción, cada RegionServer se implementa en su propio nodo de cómputo dedicado. Cuando empiece a usar HBase, se crea una tabla y luego comenzar almacenar y recuperar sus datos.

Sin embargo, en algún momento - y tal vez con bastante rapidez en los casos grandes de uso de datos - la tabla crece más allá de un límite configurable. En este punto, el sistema HBase divide automáticamente la mesa y distribuye la carga a otro RegionServer.

En este proceso, denominado a menudo auto-sharding, HBase escala automáticamente a medida que agrega datos al sistema - una gran ventaja en comparación con la mayoría de los sistemas de gestión de base de datos, que requieren intervención manual para escalar el sistema global más allá de un único servidor. Con HBase, siempre y cuando usted tiene en el rack otro servidor de repuesto que está configurado, de escala es automático!

¿Por qué establecer un límite en las tablas y luego dividir? Después de todo, HDFS es el mecanismo de almacenamiento subyacente, por lo que todos los discos disponibles en el clúster HDFS se encuentran disponibles para el almacenamiento de sus mesas. (Sin contar el factor de replicación, por supuesto.) Si tiene un clúster completo a su disposición, ¿por qué limitarse a uno RegionServer para administrar sus tablas?

Sencillo. Usted puede tener cualquier número de tablas grandes o pequeñas y usted querrá HBase aprovechar todas RegionServers disponibles en la gestión de sus datos. Usted quiere aprovechar al máximo el rendimiento de cómputo de la agrupación. Por otra parte, con muchos clientes acceder a su sistema HBase, usted querrá utilizar muchos RegionServers para satisfacer la demanda.

HBase aborda todas estas preocupaciones para usted y escala automáticamente en términos de capacidad de almacenamiento y poder de cómputo.

imagen0.jpg