Familias de columna en el modelo de datos HBase

En los datos HBase modelo columnas se agrupan en las familias de las columnas, que debe definirse en la delantera durante la creación de la tabla. Familias de columna se almacenan juntos en el disco, por lo que HBase se conoce como un almacén de datos orientada a columnas.

Vista lógica de Información del cliente Contacto en HBase
Fila claveColumna Familia: {Columna Calificador: Versión: Valor}
00001CustomerName: {'FN': 1383859182496: 'John',
'LN': 1383859182858: 'Smith',
'MN': 1383859183001: 'Timoteo',
'MN': 1383859182915: 'T'}
ContactInfo: {'EA': 1383859183030:'[email protected] ',
'SA': 1383859183073: «1 Hadoop Lane, NY11111 '}
00002CustomerName: {'FN': 1383859183103: 'Jane',
'LN': 1383859183163: 'Doe',
Datos de contacto: {
'SA': 1383859185577: «7 HBase Ave, CA22222 '}

La tabla muestra dos familias columna: CustomerName y ContactInfo. Al crear una tabla en HBase, se requiere el desarrollador o administrador definir una o más familias de columna utilizando caracteres imprimibles.

En general, las familias de las columnas permanecen fijos durante todo el curso de la vida de una tabla HBase pero las nuevas familias de columna se pueden agregar mediante el uso de comandos de administración. La recomendación oficial para el número de familias de las columnas por tabla es de tres o menos. (Consulte la documentación en línea de Apache HBase.)

Además, debe guardar los datos con patrones de acceso similares en la misma familia de columna - que no quieres el segundo nombre de un cliente almacena en una familia columna separada del nombre o apellido, porque por lo general, acceder a todos los datos de nombres a la vez.

Familias de columnas se agrupan en el disco, por lo que la agrupación de los datos con los patrones de acceso similares reduce el acceso general de disco y aumenta el rendimiento.




» » » » Familias de columna en el modelo de datos HBase