Bases de datos par clave-valor en un entorno de datos grande

Por el momento, la más simple de las bases de datos en un entorno de grandes datos NoSQL (no de sólo-SQL) son las que emplean el modelo par clave-valor (KVP). Bases de datos KVP no requieren un esquema (como RDBMS) y ofrecen una gran flexibilidad y escalabilidad.

Bases de datos KVP no ofrecen ACID (atomicidad, coherencia, aislamiento, durabilidad) capacidad y requieren ejecutores a pensar en la colocación de datos, replicación y tolerancia a fallos, ya que no se controlan expresamente por la propia tecnología. Bases de datos KVP no se escriben. Como resultado, la mayoría de los datos se almacenan como cadenas.

Llave	Valor
Color	Azul
Libation	Cerveza
Héroe	Militar

Se trata de un conjunto muy simplificada de claves y valores. En una aplicación de datos grande, muchas personas van a tener ideas diferentes acerca de los colores, libaciones, y los héroes.

Llave	Valor
FacebookUser12345_Color	rojo
TwitterUser67890_Color	Pardusco
FoursquareUser45678_Libation	" Vino blanco "
Google + User24356_Libation	" martini seco con un toque "
LinkedInUser87654_Hero	" Top ventas intérprete "

Como el número de usuarios aumenta, hacer el seguimiento de las teclas precisas y valores relacionados puede ser un reto. Si necesita hacer un seguimiento de las opiniones de millones de usuarios, el número de pares clave-valor asociado a ellos puede aumentar exponencialmente. Si no desea limitar las opciones de los valores, la representación de cadena genérica de KVP proporciona flexibilidad y facilidad de lectura.

Es posible que tenga algunos datos ayuda de organización adicionales en una base de datos clave-valor. La mayoría ofrecen la capacidad de teclas agregados (y sus valores relacionados) en una colección. Las colecciones pueden consistir en cualquier número de pares clave-valor y no requieren el control exclusivo de los elementos KVP individuales.

Una clave-valor de base de datos par de código abierto ampliamente utilizado se llama Riak. Es desarrollado y apoyado por una compañía llamada Basho Technologies y se pone a disposición bajo la licencia Apache Software v2.0.

Riak es una aplicación muy rápida y escalable de una base de datos clave-valor. Es compatible con un entorno de alto volumen con los datos que cambia rápidamente, ya que es ligero. Riak es particularmente eficaz en el análisis en tiempo real de la negociación de los servicios financieros. Usa " cubos " como un mecanismo de organización para las colecciones de claves y valores.

Implementaciones Riak son grupos de nodos físicos o virtuales dispuestas de un modo peer-to-peer. No existe un nodo principal, por lo que el clúster es resistente y altamente escalable. Todos los datos y las operaciones se distribuyen en todo el clúster. Racimo grande realizar agrupaciones mejores y más rápidas que con menos nodos. Comunicación en el clúster se implementa a través de un protocolo especial llamado chisme. El chisme almacena información de estado acerca de la información de clúster y acciones sobre los cubos.

Riak tiene muchas características y es parte de un ecosistema que consiste en lo siguiente:

Procesamiento en paralelo: Uso de MapReduce, Riak es compatible con una capacidad para descomponer y recomponer consultas a través del clúster para el análisis en tiempo real y computación.
Enlaces y enlace a pie: Riak puede ser construido para imitar una base de datos gráfica utilizando enlaces. Un enlace puede ser pensado como una conexión unidireccional entre pares clave-valor. Caminar (siguiente) los enlaces proporcionarán un mapa de relaciones entre pares clave-valor.
Buscar: Riak búsqueda tiene una capacidad de búsqueda de texto completo con tolerancia a fallos, distribuida. Cubos pueden ser indexados para la resolución rápida de valor para llaves.
Índices secundarios: Los desarrolladores pueden etiquetar valores con uno o más valores de campo clave. La aplicación puede consultar el índice y devolver una lista de claves coincidentes. Esto puede ser muy útil en implementaciones grandes datos porque la operación es atómica y apoyará comportamientos en tiempo real.

Implementaciones Riak son los más adecuados para

Los datos de usuario de las redes sociales, comunidades, o juegos
De alto volumen, la recopilación de datos ricos en medios de comunicación y almacenamiento
Capas de almacenamiento en caché para la conexión de las bases de datos NoSQL RDBMS y
Las aplicaciones móviles que requieren flexibilidad y fiabilidad

Sobre el autor

Tiendas de valores clave en nosql

Clave # 8208-valor tiendas NoSQL tienen un registro con un campo de identificación - la clave en # 8208-valor almacenes de claves - y un conjunto de datos. Estos datos pueden ser uno de los siguientes:Una pieza arbitraria de datos que interpreta…

La gestión de disponibilidad en nosql

Al igual que con otros tipos de bases de datos NoSQL, con tiendas de valores clave, usted puede negociar un poco de coherencia por alguna disponibilidad. Tiendas de clave-valor suelen proporcionar una amplia gama de modelos de consistencia y…

Gestión de datos en nosql

Una vez que logran las teclas de forma apropiada, ya está listo para diseñar la forma de almacenar datos con NoSQL y asegurarse de que es seguro y siempre accesible para el trabajo que tiene que hacer.Los tipos de datos en las tiendas de…

Gestión de llaves en nosql

Capacidades de lectura rápidas clave-valor tiendas 'se derivan de su uso de teclas bien definidos. Estas teclas son típicamente hash, lo que da un almacén de claves-valor de una forma muy predecible de determinar qué partición (y por lo tanto…

Bases de datos de procesamiento masivamente paralelo

Para proporcionar una mejor comprensión de las alternativas SQL-en-Hadoop Hive a, podría ser útil revisar una cartilla en el procesamiento paralelo masivo (MPP) bases de datos primero.Apache Hive es en capas en la parte superior del sistema de…

NoSQL y motores de búsqueda

Puede parecer extraño hablar de motores de búsqueda y NoSQL juntos, pero muchos de los motores de búsqueda de hoy utilizar una arquitectura muy similar a las bases de datos NoSQL. Sus índices y procesamiento de consultas son altamente…

Almacenes de datos NoSQL frente hadoop

Almacenes de datos NoSQL originalmente suscribieron a la noción " Apenas diga no a SQL " (parafraseando a partir de una campaña publicitaria anti-drogas en la década de 1980), y eran una reacción a las limitaciones percibidas de bases de datos…

Términos y definiciones NoSQL

Para que tu cabeza alrededor NoSQL puede ser un poco difícil. Si usted ha estudiado las bases de datos en la escuela, que puede haber sido adoctrinado en una forma relacional de pensamiento. Decir base de datos a la mayoría de la gente, y ellos…

Almacene grandes datos con HBase

HBase es una no relacional (columnar) base de datos distribuida, que utiliza HDFS como su almacén de persistencia para proyectos de grandes datos. Es el modelo de Google BigTable y es capaz de albergar mesas muy grandes (miles de millones de…

Bases de datos de columna en un entorno de datos grande

Bases de datos de columnas pueden ser muy útiles en su proyecto de datos grande. Bases de datos relacionales son fila orientada, como los datos en cada fila de una tabla se almacena junto. En una columnar, o base de datos orientada a columnas, se…

Bases de datos de documentos en un entorno de datos grande

Usted encontrará dos tipos de bases de datos de documentos para proyectos de datos grandes. Uno a menudo se describe como un repositorio de contenido completo de estilo de documento. La otra es una base de datos para el almacenamiento de…

Las bases de datos del gráfico en un entorno de datos grande

La estructura fundamental de las bases de datos del gráfico de datos grande se llama " ganglios relación ". Esta estructura es más útil cuando hay que tratar con datos altamente interconectados. Los nodos y relaciones de apoyo propiedades, un…

maniqui-es.com » Computadoras y software » Big Data » Ingeniería » Bases de datos par clave-valor en un entorno de datos grande