Características tiendas columna BigTable / amplia en las bases de datos NoSQL
Clones Bigtables son un tipo de base de datos NoSQL que surgió de papel Bigtable seminal de Google. Bigtables son una forma altamente distribuida para gestionar los datos tabulares. Estas tablas de datos no se relacionan entre sí como si estuvieran en un sistema de gestión de bases de datos relacionales tradicionales (RDBMS). Estas son las características más importantes de las opciones de base de datos populares.
Característica Área | Accumulo | Cassandra | HBase | Hypertable |
---|
Ácido o base | ÁCIDO | BASE | BASE | ÁCIDO |
HA Réplicas | Sí, sincronización | Sí, asíncrono | Sí, sincronización | TBD |
DR Réplicas | Como HDFS | Sí, Asyn | Como HDFS | TBD |
Tipos de datos | No hay soporte de tipo de datos. | Sí, el esquema debe definirse en la delantera. | No hay soporte de tipo de datos. | No hay soporte de tipo de datos. |
La indexación de datos | No indexación secundaria. | No es un verdadero " índice secundario " característica - onlyallows columnas que se utilizará en las consultas - no acelera la recuperación updata. Soporta filtros Bloom. | No indexación. Soporta filtros Bloom. | Índices secundarios completos. |
Consulta y búsqueda | Usos Mapa / Reducir para acceder a datos. | CQL lenguaje de consulta similar a SQL. | Usos Mapa / Reducir para acceder a datos. Se puede utilizar con Hive QueryEngine. | Valor coincidencia exacta y la cadena " comienza con " queries.Column existe apoyo término de consulta. No Rango. |
Comerciales | Apache 2. Utilizado en el gobierno para las necesidades BigTable seguras. | La versión comercial de DataStax. | Apache 2. Disponible a partir de un número de proveedores de Hadoop. | GPL v3 licencia. |
Otros | El control de acceso basado en rol (RBAC) y celular (por valor) levelsecurity útil para casos de uso gobierno. Autenticación personalizada y autorización plug-ins disponibles. Partialencryption al resto de los datos en Accumulo 1.6. (Intermedio recoveryfiles no encriptada.) | 0.5-1.0TB de datos recomendado por nodo. SSD storagerecommended. 32 GB de RAM y 4/8 núcleos recomendados. Sistema AWS recomendada para 1 TB de datos es 2.2xlarge (60 GB de RAM + SSDstorage), o menor c3.2large de 100 GB de datos. Soporte para el cifrado de datos en reposo (pero no los registros de diario). | Visto como la más lenta de las bases de datos NoSQL basadas en Hadoop. " Endpoints " proporcionar una funcionalidad similar a StoredProcedures. | Función de asignación de memoria adaptativa sintoniza automáticamente RAMusage para aplicaciones de escritura pesada y lectura pesados. |
Sobre el autor
Bases de datos NoSQL Híbridos Dada la variedad de tipos de datos que se gestiona bases de datos NoSQL, estás perdonado si piensa que necesita tres bases de datos diferentes para gestionar todos sus datos. Sin embargo, aunque cada base de datos NoSQL tiene su público principal,…
Identidad y gestión de acceso (idam) en nosql Autorizar a un usuario para acceder a la información o la funcionalidad de base de datos es una cosa, pero antes de que pueda hacer eso, usted debe estar seguro de que el sistema " sabe " que el usuario es quien dice ser. Aquí es donde entra en…
La gestión de diferentes tipos de datos con nosql Bases de datos NoSQL no se restringen a un filas # 8208 y # 8208 enfoque columnas. Están diseñados para manejar una gran variedad de datos, incluidos los datos cuya estructura cambia con el tiempo y cuyas interrelaciones aún no se conocen.Bases…
Bases de datos de procesamiento masivamente paralelo Para proporcionar una mejor comprensión de las alternativas SQL-en-Hadoop Hive a, podría ser útil revisar una cartilla en el procesamiento paralelo masivo (MPP) bases de datos primero.Apache Hive es en capas en la parte superior del sistema de…
NoSQL para dummies Clones Bigtables son un tipo de base de datos NoSQL que surgió de papel Bigtable seminal de Google. Bigtables son una forma altamente distribuida para gestionar los datos tabulares. Estas tablas de datos no se relacionan entre sí como si…
NoSQL y motores de búsqueda Puede parecer extraño hablar de motores de búsqueda y NoSQL juntos, pero muchos de los motores de búsqueda de hoy utilizar una arquitectura muy similar a las bases de datos NoSQL. Sus índices y procesamiento de consultas son altamente…
Almacenes de datos NoSQL frente hadoop Almacenes de datos NoSQL originalmente suscribieron a la noción " Apenas diga no a SQL " (parafraseando a partir de una campaña publicitaria anti-drogas en la década de 1980), y eran una reacción a las limitaciones percibidas de bases de datos…
Términos y definiciones NoSQL Para que tu cabeza alrededor NoSQL puede ser un poco difícil. Si usted ha estudiado las bases de datos en la escuela, que puede haber sido adoctrinado en una forma relacional de pensamiento. Decir base de datos a la mayoría de la gente, y ellos…
Nosql Escala Una característica común de los sistemas NoSQL es su capacidad para escalar a través de muchos servidores de las materias primas. Estas plataformas relativamente baratos significan que usted puede ampliar las bases de datos mediante la adición…
Almacene grandes datos con HBase HBase es una no relacional (columnar) base de datos distribuida, que utiliza HDFS como su almacén de persistencia para proyectos de grandes datos. Es el modelo de Google BigTable y es capaz de albergar mesas muy grandes (miles de millones de…
Almacenamiento de datos estructurados y procesamiento de Hadoop Al considerar las capacidades de Hadoop para trabajar con datos estructurados (o trabajar con datos de cualquier tipo, para el caso), recuerda las características fundamentales de Hadoop: Hadoop es, ante todo, una plataforma de almacenamiento y…
Bases de datos de columna en un entorno de datos grande Bases de datos de columnas pueden ser muy útiles en su proyecto de datos grande. Bases de datos relacionales son fila orientada, como los datos en cada fila de una tabla se almacena junto. En una columnar, o base de datos orientada a columnas, se…