NoSQL para dummies

Clones Bigtables son un tipo de base de datos NoSQL que surgió de papel Bigtable seminal de Google. Bigtables son una forma altamente distribuida para gestionar los datos tabulares. Estas tablas de datos no se relacionan entre sí como si estuvieran en un sistema de gestión de bases de datos relacionales tradicionales (RDBMS). Estas son las características más importantes de las opciones de base de datos populares.

Característica ÁreaAccumuloCassandraHBaseHypertable
Ácido o baseÁCIDOBASEBASEÁCIDO
HA RéplicasSí, sincronizaciónSí, asíncronoSí, sincronizaciónTBD
DR RéplicasComo HDFSSí, AsynComo HDFSTBD
Tipos de datosNo hay soporte de tipo de datos.Sí, el esquema debe definirse en la delantera.No hay soporte de tipo de datos.No hay soporte de tipo de datos.
La indexación de datosNo indexación secundaria.No es un verdadero " índice secundario " característica - onlyallows columnas que se utilizará en las consultas - no acelera la recuperación updata.
Soporta filtros Bloom.
No indexación.
Soporta filtros Bloom.
Índices secundarios completos.
Consulta y búsquedaUsos Mapa / Reducir para acceder a datos.CQL lenguaje de consulta similar a SQL.Usos Mapa / Reducir para acceder a datos. Se puede utilizar con Hive QueryEngine.Valor coincidencia exacta y la cadena " comienza con " queries.Column existe apoyo término de consulta. No Rango.
ComercialesApache 2. Utilizado en el gobierno para las necesidades BigTable seguras.La versión comercial de DataStax.Apache 2. Disponible a partir de un número de proveedores de Hadoop.GPL v3 licencia.
OtrosEl control de acceso basado en rol (RBAC) y celular (por valor) levelsecurity útil para casos de uso gobierno.
Autenticación personalizada y autorización plug-ins disponibles. Partialencryption al resto de los datos en Accumulo 1.6. (Intermedio recoveryfiles no encriptada.)
0.5-1.0TB de datos recomendado por nodo. SSD storagerecommended. 32 GB de RAM y 4/8 núcleos recomendados.
Sistema AWS recomendada para 1 TB de datos es 2.2xlarge (60 GB de RAM + SSDstorage), o menor c3.2large de 100 GB de datos.
Soporte para el cifrado de datos en reposo (pero no los registros de diario).
Visto como la más lenta de las bases de datos NoSQL basadas en Hadoop.
" Endpoints " proporcionar una funcionalidad similar a StoredProcedures.
Función de asignación de memoria adaptativa sintoniza automáticamente RAMusage para aplicaciones de escritura pesada y lectura pesados.

Key-Value Store de bases de datos NoSQL Características

Tiendas de valores clave son bases de datos sin lujos NoSQL que generalmente delegan todo valor de manipulación al código de la aplicación en sí. Estas son las características clave de clave-valor comunes bases de datos de la tienda.

imagen0.jpg

Documento Base de datos NoSQL Características

Bases de datos NoSQL documento son flexibles y el esquema agnóstico, lo que significa que puede cargar cualquier tipo de documento sin la base de datos necesidad de conocer la estructura del documento en la delantera. Bases de datos NoSQL Documento apoyan estas características importantes.

Característica ÁreaCouchbaseMicrosoft DocumentDBMarkLogic servidorMongoDB
Ácido o baseBASEBASE, la selección consistencia controlador de clienteACID, totalmente serializableBASE, la selección consistencia controlador de cliente
HA RéplicasSinGestionado por la plataforma Azure.Sí, sincronizaciónSí, asíncrono (por defecto)
DR RéplicasSí, maestro-maestro, asíncronoGestionado por la plataforma Azure.Sí, asíncronoSí, asíncrono
Tipos de datosModelo de documento JSONModelo de documento JSON. Los mismos tipos soportados como JSON -string, números (IEEE754) y booleanos. Extended fecha-hora, guid, tipos Int64 compatibles.XML, JSON, texto y documentos binarios compatibles. Todos los tipos de datos W3C XMLSCHEMA compatibles.Modelo de documento JSON. Los mismos tipos como JSON. Apoyo a los datos 2Dgeospatial.
La indexación de datosÍndices secundarios compatibles. Vistas compatibles. No universalindex. Índices actualizan de forma asíncrona.Índice universal para todos los documentos JSON. Indexincludes Universal detección índice de rango automático. Índices eventuallyconsistent, de forma predeterminada.Índice universal para todos los documentos de texto, XML y JSON. Viewsnot compatible. Apoyos van índices. Índices actualizan dentro de transacción theACID. Índices 2D geoespaciales.No índice universal. Índices secundarios configurable en namedproperties.
Consulta y búsquedaAPI Memcached totalmente compatible. Las consultas sobre los documentos y viewssupported.Utiliza SQL a través de HTTP para las consultas. Sin gratuita grammarsupport búsqueda de texto. Consultas de proyección y alcance compatibles.Texto libre (similar al cuadro de búsqueda de Google) búsqueda gramática andstructured consultas tanto apoyaron. Rango consulta supported.Aggregates pueden calcularse durante una búsqueda. Geoespacial queriessupported.Custom formato JSON consulta con soporte para consultas de rango. Apoyo en la búsqueda gramática del texto Nofree. Texto y Geoespacial (GeoJSON) consultas compatibles.
ComercialesSólo Comercial modelo. Ofrecido sólo en de Microsoft Azureplatform.Sólo Comercial modelo.AGPL licencia. Las licencias comerciales disponibles.
OtrosPlataforma Azure de Microsoft esconde muchos de los complexitiesof escalar una gran base de datos a través de múltiples geografías.Proporciona quedadas en algún modelo de seguridad de las oficinas a nivel worldwide.Document MarkLogic implementado.Fuerte apoyo para reuniones en locales en muchos officesworldwide MongoDB. 10 oficiales y 32 controladores de cliente comunidad.

Triple tienda y Gráfico NoSQL Database Características

Puede utilizar un almacén de triple o gráfico de base de datos NoSQL si usted tiene una red de datos interconectadas, o simplemente puede etiquetar sus datos e inferir relaciones de acuerdo a los registros que comparten las mismas etiquetas. Estos productos de bases de datos soportan estas características importantes.

Característica ÁreaAllegroGraphMarkLogic servidorNeo4jOrientDB
Ácido o baseACID, totalmente serializableACID, totalmente serializableACID, lectura confirmadaACID, totalmente serializable o leer comprometida
HA RéplicasSinSí, sincronizaciónSinSí, sincronización
DR RéplicasSí, asíncronoSí, asíncronoSí, Sync (cuando esté disponible)TBD
Tipos de datosSoporta enteros, enteros sin signo de punto flotante, decimales, y el tiempo y fechas.JSON, binario, XML, el almacenamiento de texto libre compatibles. Todos los tipos de esquema W3C RDF andXML compatibles.Tipos de datos Java soportados.JSON, binario, y el almacenamiento RDF compatible.
La indexación de datosÍndices Triple optimizados para las consultas de estilo gráfico. 7 SPOGIindexes.Índice Triple optimizado para profundidad conocida de triple tienda stylequeries. 4 índices SPOGI.Índices triples optimizados para las consultas de estilo gráfico (caminoMinimo, subgrafo, y así sucesivamente). 7 índices SPOGI.Tiene su propio índice de triple. Optimizado para stylequeries triples tienda.
Consulta y búsquedaSPARQL 1.0 y 1.1 compatibles. SPARQL Inferencia notación (SPIN) API compatible.SPARQL 1.0 cumplimiento, SPARQL 1.1 cumplimiento parcial (se benearly compatible en la próxima versión 8). Inferencia apoyo inversión 8.Lenguaje de consulta Cypher proporciona, semejando SQL. No standardssupport. Más corta trayectoria, Dijkstra, y un gráfico * algorithmssupported.No SPARQL W3C o compatibilidad con el protocolo GraphStore para almacenar orquerying datos RDF. Tiene propio lenguaje de consulta.
ComercialesSólo Comercial modelo. Disponible a partir de Franz, Inc. gratuito limitado versionavailable 5 millones de triples. Versión desarrollador availablelimited a 50 millones de triples.Sólo Comercial modelo. Nivel de entrada " EssentialEnterprise " edición para pequeños grupos, y " GlobalEnterprise " para grandes grupos.Siempre bajo AGPL. Licencia comercial disponible. Discountedstart-up licencia disponible.Condiciones favorables comerciales disponibles para nuevas empresas. Commercialsupport disponible para Apache 2 edición con licencia, aunque featurelimited. Todas las funciones están disponibles sólo en commercialversion.
OtrosSeguridad a nivel de Triple compatible. Las copias de seguridad en línea withpoint en el tiempo de recuperación de apoyo. CLIF ++ y RDFS ++ supported.Includes un Análisis de Redes Sociales (ARS) de la biblioteca.A nivel de registro (Gráfico) soporte de seguridad. Proporciona quedadas en las oficinas someMarkLogic todo el mundo.Neo Tecnologías recomiendan SSDs para un buen rendimiento.A nivel de registro (Gráfico) soporte de seguridad.