Almacenes de datos NoSQL frente hadoop

Almacenes de datos NoSQL originalmente suscribieron a la noción " Apenas diga no a SQL " (parafraseando a partir de una campaña publicitaria anti-drogas en la década de 1980), y eran una reacción a las limitaciones percibidas de bases de datos relacionales (basadas en SQL). No es que esta gente odiaba SQL, pero estaban cansados de forzar clavijas cuadradas en agujeros redondos mediante la resolución de problemas que las bases de datos relacionales no fueron diseñados.

Una base de datos relacional es una herramienta poderosa, pero para algunos tipos de datos (como pares clave-valor, o gráficos) y algunos patrones de uso (como el almacenamiento muy gran escala) una base de datos relacional simplemente no es práctico. Y cuando se trata de almacenamiento de gran volumen, base de datos relacional puede ser costoso, tanto en términos de costos de las licencias de base de datos y los costes de hardware. (Bases de datos relacionales están diseñados para trabajar con el hardware de nivel empresarial.)

Así que, con el movimiento NoSQL, programadores creativos desarrollaron decenas de soluciones para diferentes tipos de problemas de almacenamiento de datos y procesamiento espinosos. Estas bases de datos NoSQL suelen ofrecer escalabilidad masiva a través de la agrupación, ya menudo están diseñados para permitir un alto rendimiento y baja latencia.

El nombre NoSQL es algo engañoso porque muchas bases de datos que se ajusten a la categoría hacer contar con el apoyo de SQL (en lugar de " NoSQL " de apoyo). Piense en su nombre en lugar como " No sólo SQL ".

Las ofrendas NoSQL disponibles hoy en día se pueden dividir en cuatro categorías distintas, en función de su diseño y propósito:

Tiendas de valores clave: Esta oferta proporciona una manera de almacenar cualquier tipo de datos sin tener que utilizar un esquema. Esto está en contraste con las bases de datos relacionales, donde es necesario definir el esquema (la estructura de la tabla) antes de introducir ningún dato. Desde tiendas de clave-valor no requieren un esquema, usted tiene una gran flexibilidad para almacenar datos en muchos formatos.
En un almacén de claves-valor, una fila consiste simplemente en una clave (un identificador) y un valor, que puede ser cualquier cosa, desde un valor entero a una gran cadena de datos binarios. Muchas implementaciones de almacenes de claves y valores se basan en papel Dynamo de Amazon.
Tiendas familiares Columna: Aquí tienes las bases de datos en la que las columnas se agrupan en familias de columna y almacenados juntos en el disco.
En sentido estricto, muchas de estas bases de datos no son columnas orientado, porque se basan en papel BigTable de Google, que almacena los datos como un mapa ordenado multidimensional.
Tiendas de Documento: Esta oferta se basa en colecciones de documentos de manera similar codificados y formateados para mejorar la eficiencia. Tiendas de documentos permiten a los documentos individuales en una colección para incluir sólo un subconjunto de los campos, por lo que sólo los datos que se necesita es almacenada. Para los conjuntos de datos dispersos, en muchos campos a menudo no se poblaron, esto puede traducirse en un ahorro de espacio significativos.
Por el contrario, las columnas vacías en tablas bases de datos relacionales no ocupan espacio. Tiendas de documentos también permite la flexibilidad del esquema, ya que sólo los campos que son necesarios se almacenan, y los nuevos campos se pueden añadir. Una vez más, a diferencia de las bases de datos relacionales, estructuras de tabla se definen por adelantado antes de que se almacenan los datos, y el cambio de columnas es una tarea tediosa que afecta todo el conjunto de datos.
Las bases de datos del gráfico: Aquí tienes las bases de datos que almacenan estructuras de gráficos - representaciones que muestran colecciones de entidades (vértices o nodos) y sus relaciones (bordes) entre sí. Estas estructuras permiten a las bases de datos del gráfico a ser muy adecuado para el almacenamiento de estructuras complejas, como las relaciones que unen entre todas las páginas web conocidas. (Por ejemplo, páginas web individuales son nodos y los bordes que conectan los enlaces de una página a otra.)
Google, por supuesto, es todo sobre la tecnología gráfica, e inventó un motor de procesamiento gráfico llamado Pregel para alimentar su algoritmo PageRank. (Y sí, hay un libro blanco sobre Pregel.) En la comunidad Hadoop, hay un proyecto de Apache llamado Giraph (basado en el papel Pregel), que es un motor de procesamiento gráfico diseñado para procesar gráficos almacenados en HDFS.

Las opciones de almacenamiento de datos y de procesamiento disponibles en Hadoop están en muchos casos, las implementaciones de las categorías NoSQL enumerados aquí. Esto le ayudará a evaluar mejor las soluciones que están disponibles para usted y averigua cómo Hadoop puede complementar los almacenes de datos tradicionales.

Sobre el autor

Las características comunes de nosql

Libros y blogs NoSQL ofrecen diferentes opiniones sobre lo que una base de datos NoSQL es. Cuatro características principales de NoSQL, que se muestran en la siguiente lista, se aplican a la mayoría de las bases de datos NoSQL. La lista compara…

Bases de datos documentales y nosql

Bases de datos de documentos a veces se llaman las bases de datos agregados, ya que tienden a mantener los documentos que combinan la información en una sola unidad lógica - un agregado. Es posible que tenga un documento que incluye un episodio de…

Procesamiento gráfico en hadoop

Uno de los más emocionantes tecnologías NoSQL emergentes implica el almacenamiento y procesamiento de datos del gráfico. Se podría pensar que esta declaración es noticia vieja porque los científicos informáticos han desarrollado técnicas de…

Bases de datos NoSQL Híbridos

Dada la variedad de tipos de datos que se gestiona bases de datos NoSQL, estás perdonado si piensa que necesita tres bases de datos diferentes para gestionar todos sus datos. Sin embargo, aunque cada base de datos NoSQL tiene su público principal,…

Dentro de la memoria almacena clave-valor en bases de datos NoSQL

Las empresas deben asegurarse de que sus datos están duradera, manteniendo a lo seguro en el disco. Sin embargo, en memoria bases de datos implementados con NoSQL también son útiles en algunos casos, tales como las siguientes:De alta velocidad de…

Tiendas de valores clave en nosql

Clave # 8208-valor tiendas NoSQL tienen un registro con un campo de identificación - la clave en # 8208-valor almacenes de claves - y un conjunto de datos. Estos datos pueden ser uno de los siguientes:Una pieza arbitraria de datos que interpreta…

La gestión de diferentes tipos de datos con nosql

Bases de datos NoSQL no se restringen a un filas # 8208 y # 8208 enfoque columnas. Están diseñados para manejar una gran variedad de datos, incluidos los datos cuya estructura cambia con el tiempo y cuyas interrelaciones aún no se conocen.Bases…

NoSQL y motores de búsqueda

Puede parecer extraño hablar de motores de búsqueda y NoSQL juntos, pero muchos de los motores de búsqueda de hoy utilizar una arquitectura muy similar a las bases de datos NoSQL. Sus índices y procesamiento de consultas son altamente…

Términos y definiciones NoSQL

Para que tu cabeza alrededor NoSQL puede ser un poco difícil. Si usted ha estudiado las bases de datos en la escuela, que puede haber sido adoctrinado en una forma relacional de pensamiento. Decir base de datos a la mayoría de la gente, y ellos…

Reducir el tiempo de valor en nosql

Hora de valor es la cantidad de tiempo que se requiere que se inicie un proyecto de TI a ser capaz de darse cuenta de los beneficios del negocio. Esto puede haber beneficios tangibles en la reducción de costes o la posibilidad de realizar…

Bases de datos de columna en un entorno de datos grande

Bases de datos de columnas pueden ser muy útiles en su proyecto de datos grande. Bases de datos relacionales son fila orientada, como los datos en cada fila de una tabla se almacena junto. En una columnar, o base de datos orientada a columnas, se…

Bases de datos multidimensionales

Esta no es la primera vez en la historia reciente que han surgido y superar las ineficiencias RDBMS nuevos tipos de productos de base de datos. De vuelta en la década de 1980, se identificó una clase de aplicaciones en las que RDBMS productos…

maniqui-es.com » Computadoras y software » Big Data » Gestión de datos » Almacenes de datos NoSQL frente hadoop