Ibm grande sql y hadoop

IBM tiene una larga historia de trabajo con SQL y la tecnología de base de datos. De acuerdo con esta historia, la solución de IBM para SQL en Hadoop aprovecha los componentes de sus tecnologías de bases de datos relacionales que son portado para correr en Hadoop.

Si usted está en todo familiarizado con nombres de productos de IBM para sus productos y características Big Data, se puede adivinar fácilmente lo que han llamado su SQL en solución Hadoop: Big SQL. El objetivo de la Gran SQL es proporcionar una interfaz SQL en Hadoop que ofrece a los usuarios la mayor cantidad posible de lo que están acostumbrados con interfaces SQL para bases de datos relacionales.

Esto significa un amplio apoyo sintaxis de consulta, un rendimiento rápido que no requiere que los usuarios tener que mono con sus consultas, y la capacidad de controlar la seguridad de datos.

La figura muestra una implementación parcial de BigInsights, distribución de Hadoop de IBM corriendo Grandes SQL.

imagen0.jpg

Aquí, se puede ver un subconjunto de los nodos principales y nodos de datos detrás del firewall BigInsights. Uno de los nodos maestros se está ejecutando el servidor de Big SQL, que incluye el compilador de SQL de IBM y optimizador. También se incluyen en este nodo principal es un catálogo, donde se almacenan los metadatos y estadísticas acerca de los datos catalogados en HDFS para uso del compilador / optimizador.

Subsecciones de consultas se envían a los nodos de datos aplicables donde se almacenan los datos solicitados, y el tiempo de ejecución de SQL grande (que es el tiempo de ejecución de IBM SQL) ejecuta la carga de trabajo. En lugar de asignador de ejecución y los procesos reductores y persisten los archivos con conjuntos de resultados intermedios, Big SQL utiliza funcionando continuamente demonios que pasan mensajes entre sí.

Es importante señalar que los datos sean consultados son almacenados y gestionados por Hadoop. Gran SQL admite formatos de archivo estándar Hadoop - por ejemplo, fichero de recursos y parqué.

Gran SQL proporciona el mismo amplio soporte de SQL como los productos de base de datos relacional de IBM - por ejemplo, ANSI SQL-2011, y la compatibilidad de lenguaje de procedimientos SQL de IBM (SQL / PL). (En el momento de la escritura, IBM estaba trabajando en la prestación de apoyo para el dialecto SQL de Oracle y su lenguaje procedural PL / SQL.)

Junto con el motor SQL estándar IBM llegado una serie de otras capacidades, sobre todo de IBM de fila y la seguridad basada en la columna (también conocido como grano fino control de acceso, o FGAC), donde sólo los usuarios específicos pueden ser autorizados a ver ciertos conjuntos de filas de datos o columnas.

Gran SQL viene con el cliente estándar de IBM Data Server, que incluye un paquete de controladores. Aplicaciones de bases de datos tradicionales pueden conectarse al clúster Hadoop BigInsights y segura intercambiar datos cifrados a través de SSL.