Taladro Apache

Apache Taladro es un proyecto candidato en la incubadora de Apache. Apache taladro no es especialmente enfermiza, sin embargo. Los Apache Software Foundation (ASF) tecnologías candidatas todos comienzan como proyectos de incubadoras antes de convertirse en tecnologías oficiales ASF. Usted puede leer sobre el Apache Incubadora. Usted puede leer acerca de taladro.

Inspirado en la tecnología de Dremel de Google, el objetivo de rendimiento declarada de taladro es permitir consultas SQL contra un petabyte o más de datos distribuidos a través de servidores más de 10.000. La figura ilustra la arquitectura de Apache Taladro.

Se puede ver que la clave de la arquitectura de perforación son los servidores Drillbit desplegados en cada nodo de datos. Tenga en cuenta que cada servidor incluye un analizador de consultas, compilador, optimizador, y tiempo de ejecución, pero no es un servidor de Drillbit maestro nominado por los servidores Zookeeper, que supervisa la ejecución de las consultas y se ocupa de la tarea de reunir los conjuntos de resultados intermedios en una sola conjunto de salida.

Como Dremel, Taladro puede coexistir con, y complementar, MapReduce, pero MapReduce no se utiliza para cumplir con las consultas, al igual que con Apache Hive. En lugar de ello, los motores de ejecución llamados Brocas han sido desarrollados por los miembros de la comunidad Taladro.

Esta comunidad tiene como objetivo proporcionar consultas de baja latencia para aplicaciones tales como cuadros de mando en tiempo real de inteligencia de negocios, la detección de fraudes y otros casos de uso sensibles al tiempo. Taladro soporta tipos de datos anidados tales como tampones protocolo Avro, JSON, y Google. Estos tipos de datos anidados permiten tablas muy grandes no normalizados.

El equipo de desarrollo de perforación también está trabajando en proporcionar un amplio soporte de SQL apuntando cumplimiento SQL2003. Por último, cabe destacar que el equipo de perforación está prestando apoyo HBase modo que los usuarios podrán consultar tablas HBase con SQL.

Sobre el autor

Hadoop y colmena

Para hacer el cuento largo, Colmena ofrece Hadoop con un puente hacia el mundo RDBMS y proporciona un dialecto SQL conocida como Hive Query Language (HiveQL), que se puede utilizar para realizar tareas tipo SQL. Esa es la gran noticia, pero hay más…

Bases de datos de procesamiento masivamente paralelo

Para proporcionar una mejor comprensión de las alternativas SQL-en-Hadoop Hive a, podría ser útil revisar una cartilla en el procesamiento paralelo masivo (MPP) bases de datos primero.Apache Hive es en capas en la parte superior del sistema de…

Hawq Pivotal y hadoop

En 2010, EMC y VMware, los líderes del mercado en la entrega de TI como un servicio a través de la computación en nube, adquirieron Greenplum Corporation, las personas que habían llevado con éxito el producto Greenplum MPP Data Warehouse (DW)…

Aplicaciones en tiempo real y streaming en hadoop

El flujo del proceso del hilado parece un montón, como un marco para la ejecución por lotes. Usted podría preguntarse, "? ¿Qué pasó con esta idea de la flexibilidad para los diferentes modos de aplicaciones " Bueno, el único marco de…

Acceso SQL y colmena apache

Apache Hive es indiscutiblemente la interfaz de consulta de datos más extendida en la comunidad Hadoop. Originalmente, los objetivos de diseño de la colmena no eran para la compatibilidad de SQL completa y de alto rendimiento, pero eran para…

Sqoop 2.0 Vista previa

Con todo el éxito que rodea Sqoop 1.x a partir de su graduación de la incubadora Apache, Sqoop tiene momento! Así que, como era de esperar, Sqoop 2.0 está en los trabajos con nuevas e interesantes características en el camino. Se puede ver que…

El ecosistema Hadoop de Apache

Hadoop es más de MapReduce y HDFS (Hadoop Distributed File System): Es también una familia de proyectos relacionados (un ecosistema, en realidad) para la computación distribuida y el procesamiento de datos a gran escala. La mayoría (pero no…

La arquitectura de la colmena apache

Al examinar los elementos de Apache Hive muestran, se puede ver en la parte inferior que la colmena se sienta encima del Sistema Hadoop Distributed File (HDFS) y sistemas de MapReduce.En el caso de MapReduce, los figureshows tanto los componentes 1…

Bases de datos de columna en un entorno de datos grande

Bases de datos de columnas pueden ser muy útiles en su proyecto de datos grande. Bases de datos relacionales son fila orientada, como los datos en cada fila de una tabla se almacena junto. En una columnar, o base de datos orientada a columnas, se…

Configuración del equipo para php y mysql desarrollo web

Para utilizar el ordenador local para desarrollar su sitio Web, debe instalar un servidor web, PHP, y MySQL. PHP y MySQL son gratis para descargar y utilizar. Instalación del servidor WebDespués de configurar el equipo, es necesario instalar un…

Tamaños de brocas comúnmente utilizados en la electrónica

Circuitos de construcción y otros aparatos electrónicos requiere un pequeño taladro eléctrico, inalámbrico o no. Invierta en un pequeño banco de montaje en la prensa de taladro si está instalando circuitos en cajas y armarios de proyectos por…

Gimnasio Paleo articulación taladro habilidad: el taladro a tope a pared

El taladro-culo-a-pared ayuda a encontrar la posición óptima de la bisagra. En pocas palabras, le muestra exactamente dónde debería estar pegando su culo. Y todo lo que necesita hacer este ejercicio es un trozo de pared. Agrandar1Encontrar una…

maniqui-es.com » Computadoras y software » Big Data » Gestión de datos » Taladro Apache