Características principales hiveql

La comunidad Apache Hive vibrante y activa continuamente añadirs a una ya extensa conjunto de características, lo que hace que la cobertura exhaustiva aún más difícil. La siguiente lista resume algunas de las características clave HiveQL para usted:

  • Seguridad: Apache Hive ofrece un subsistema de seguridad que puede ser muy útil en la prevención de la corrupción o el compromiso de datos accidentales entre los miembros de confianza de los grupos de trabajo. Sin embargo, el Manual Colmena Idioma establece claramente que el subsistema de Colmena de Seguridad no está diseñado para evitar que los usuarios nefastos de comprometer un sistema Colmena.

    La seguridad de la colmena se puede establecer para los usuarios individuales, grupos y funciones administrativas. Colmena ofrece privilegios que se pueden conceder o revocadas a los usuarios, grupos o roles administrativos. El comunicado de la Colmena 0,10 mejoró la seguridad en entornos multi-usuario al proporcionar autorización al MetaStore y futuros lanzamientos Hive proporcionará creciente integración con el marco de seguridad Hadoop. Kerberos está emergiendo como la tecnología preferida para asegurar Hadoop.

  • Bloqueo Multi-usuario: Hive apoya el acceso de almacén multiusuario cuando se configura con Apache Zookeeper. Sin este apoyo, un usuario puede leer una tabla a la vez que otro usuario está eliminando esa mesa - que es, obviamente, inaceptable.

    Acceso Multi-usuario está habilitado a través de variables de configuración en el archivo de sección-site.xml. Una vez configurado, Colmena adquiere implícitamente cerraduras través Zookeeper para ciertas operaciones de tabla. Los usuarios también pueden gestionar de forma explícita las cerraduras en la Colmena de la CLI. Cerraduras y propiedades de configuración asociados / variables que se describen en el Manual Colmena Idioma.

  • Compresión: La compresión de datos no sólo puede ahorrar espacio en el HDFS, sino también mejorar el rendimiento al reducir el tamaño total de las operaciones de entrada / salida. Además, la compresión entre los cartógrafos y reductores de Hadoop puede mejorar el rendimiento, ya que menos datos se pasan entre los nodos del clúster.

    Hive es compatible con la compresión intermedia entre los cartógrafos y reductores, así como la compresión de salida de la mesa. Hive también entiende cómo ingerir datos comprimidos en el almacén. Archivos comprimidos con Gzip o Bzip2 pueden ser leídos por colmena de DATOS DE CARGA comandos.

  • Funciones: HiveQL ofrece un rico conjunto de integrados operadores, funciones integradas, funciones integradas de agregados, y las funciones de la tabla de generación incorporadas. Varios ejemplos de este capítulo utilización incorporados operadores, así como una función de las funciones de agregado (AVG, MIN, y CUENTA, por ejemplo).

    Para una lista de todas las funciones integradas para cualquier versión particular Colmena, utilice el VER FUNCIONES Comando HiveQL. También puede obtener información acerca de una función incorporada mediante el uso de los comandos HiveQL DESCRIBE LA FUNCIÓN function_name y DESCRIBE función ampliada function_name.

    Usando el EXTENDIDO palabra clave devuelve a veces ejemplos de uso para la función incorporada especificada. Además, Hive permite a los usuarios crear sus propias funciones, llamadas funciones definidas por el usuario, o UDF. Usando marco UDF basadas en Java de la colmena, puede crear funciones adicionales, incluyendo agregados y funciones de tabla de generación. Esta característica es una de las razones por las que la colmena puede funcionar como una herramienta ETL.




» » » » Características principales hiveql