Taladro Apache

Apache Taladro es un proyecto candidato en la incubadora de Apache. Apache taladro no es especialmente enfermiza, sin embargo. Los Apache Software Foundation (ASF) tecnologías candidatas todos comienzan como proyectos de incubadoras antes de convertirse en tecnologías oficiales ASF. Usted puede leer sobre el Apache Incubadora. Usted puede leer acerca de taladro.

Inspirado en la tecnología de Dremel de Google, el objetivo de rendimiento declarada de taladro es permitir consultas SQL contra un petabyte o más de datos distribuidos a través de servidores más de 10.000. La figura ilustra la arquitectura de Apache Taladro.

imagen0.jpg

Se puede ver que la clave de la arquitectura de perforación son los servidores Drillbit desplegados en cada nodo de datos. Tenga en cuenta que cada servidor incluye un analizador de consultas, compilador, optimizador, y tiempo de ejecución, pero no es un servidor de Drillbit maestro nominado por los servidores Zookeeper, que supervisa la ejecución de las consultas y se ocupa de la tarea de reunir los conjuntos de resultados intermedios en una sola conjunto de salida.

Como Dremel, Taladro puede coexistir con, y complementar, MapReduce, pero MapReduce no se utiliza para cumplir con las consultas, al igual que con Apache Hive. En lugar de ello, los motores de ejecución llamados Brocas han sido desarrollados por los miembros de la comunidad Taladro.

Esta comunidad tiene como objetivo proporcionar consultas de baja latencia para aplicaciones tales como cuadros de mando en tiempo real de inteligencia de negocios, la detección de fraudes y otros casos de uso sensibles al tiempo. Taladro soporta tipos de datos anidados tales como tampones protocolo Avro, JSON, y Google. Estos tipos de datos anidados permiten tablas muy grandes no normalizados.

El equipo de desarrollo de perforación también está trabajando en proporcionar un amplio soporte de SQL apuntando cumplimiento SQL2003. Por último, cabe destacar que el equipo de perforación está prestando apoyo HBase modo que los usuarios podrán consultar tablas HBase con SQL.