Las bases de datos no relacionales en un entorno de datos grande
Las bases de datos no relacionales no se basan en la tabla / modelo clave endémica de RDBMS (sistemas de gestión de base de datos relacional). En resumen, los datos de la especialidad en el gran mundo de los datos requiere persistencia especialidad y técnicas de manipulación de datos. Aunque estos nuevos estilos de bases de datos ofrecen algunas respuestas a sus desafíos de datos grandes, no son un boleto expresa a la línea de meta.
Una emergente, la clase popular de la base de datos no relacional se llama no sólo SQL (NoSQL). Originalmente los creadores imaginaron bases de datos que no requerían el modelo relacional y SQL. A medida que estos productos fueron introducidos en el mercado, la definición se suavizó un poco y ahora se considera como " no sólo SQL, " de nuevo haciendo una reverencia a la ubicuidad de SQL.
La otra clase es bases de datos que no son compatibles con el modelo relacional, pero dependen de SQL como un medio principal de la manipulación de los datos dentro. A pesar de que las bases de datos relacionales y no relacionales tienen fundamentos similares, ¿cómo se llevan a cabo los fundamentos crea la diferenciación. Tecnologías de bases de datos no relacionales tienen las siguientes características en común:
Escalabilidad: En este caso, esto se refiere a la capacidad de escribir datos a través de múltiples almacenes de datos al mismo tiempo sin tener en cuenta las limitaciones físicas de la infraestructura subyacente. Otra dimensión importante es sin costura. Las bases de datos deben ser capaces de expandirse y contraerse en respuesta a flujos de datos y hacerlo invisible para los usuarios finales.
Datos y consulta de modelo: En lugar de la fila, columna, estructura clave, bases de datos no relacionales utilizan marcos especiales para almacenar datos con un conjunto necesario de las API de consulta de especialidad para acceder de forma inteligente los datos.
Diseño Persistencia: La persistencia es aún un elemento crítico en las bases de datos no relacionales. Debido a la alta velocidad, variedad y volumen de datos grandes, estas bases de datos utilizan mecanismos de diferencia por persistir los datos. La opción más alto rendimiento es " en la memoria, " donde toda la base de datos se mantiene en el sistema de memoria muy rápida de sus servidores.
La diversidad de interfaz: Aunque la mayoría de estas tecnologías soportan APIs REST como su " ir a " interfaz, también ofrecen una amplia variedad de mecanismos de conexión para los programadores y administradores de bases de datos, incluyendo las herramientas de análisis y presentación de informes / visualización.
La consistencia eventual: Mientras RDBMS utiliza ACID (atomicidad, coherencia, aislamiento, durabilidad) para garantizar la coherencia de los datos, DBMS no relacionales utilizan BASE. BASE significa Básicamente Disponible, estado suave y consistencia eventual. Consistencia eventual es más importante, ya que es responsable de la resolución de conflictos cuando los datos está en movimiento entre los nodos de una aplicación distribuida. El estado de los datos es mantenida por el software y el modelo de acceso se basa en la disponibilidad básica.
Sobre el autor
Bases de datos de procesamiento masivamente paralelo Para proporcionar una mejor comprensión de las alternativas SQL-en-Hadoop Hive a, podría ser útil revisar una cartilla en el procesamiento paralelo masivo (MPP) bases de datos primero.Apache Hive es en capas en la parte superior del sistema de…
NoSQL y motores de búsqueda Puede parecer extraño hablar de motores de búsqueda y NoSQL juntos, pero muchos de los motores de búsqueda de hoy utilizar una arquitectura muy similar a las bases de datos NoSQL. Sus índices y procesamiento de consultas son altamente…
Almacenes de datos NoSQL frente hadoop Almacenes de datos NoSQL originalmente suscribieron a la noción " Apenas diga no a SQL " (parafraseando a partir de una campaña publicitaria anti-drogas en la década de 1980), y eran una reacción a las limitaciones percibidas de bases de datos…
Almacene grandes datos con HBase HBase es una no relacional (columnar) base de datos distribuida, que utiliza HDFS como su almacén de persistencia para proyectos de grandes datos. Es el modelo de Google BigTable y es capaz de albergar mesas muy grandes (miles de millones de…
Bases de datos de columna en un entorno de datos grande Bases de datos de columnas pueden ser muy útiles en su proyecto de datos grande. Bases de datos relacionales son fila orientada, como los datos en cada fila de una tabla se almacena junto. En una columnar, o base de datos orientada a columnas, se…
El diseño de una base de datos relacional para la consulta y presentación de informes de soporte Su entorno de almacenamiento de datos o un mercado de datos específica que su almacén principal de datos alimentará podría tener la misión de generar un conjunto finito y predecible de los informes. Aquí es un enfoque para el diseño de una…
Capa 2 de la pila de grandes datos: bases de datos operacionales En el núcleo de cualquier entorno de datos grande, y la capa 2 de la pila de datos grande, son los motores de bases de datos que contienen las colecciones de elementos de datos relevantes para su negocio. Estos motores tienen que ser rápido,…
Bases de datos multidimensionales Esta no es la primera vez en la historia reciente que han surgido y superar las ineficiencias RDBMS nuevos tipos de productos de base de datos. De vuelta en la década de 1980, se identificó una clase de aplicaciones en las que RDBMS productos…
RDBMS en un entorno de datos grande Gran datos se está convirtiendo en un elemento importante en la forma en las organizaciones están aprovechando de datos de gran volumen a la velocidad adecuada para resolver los problemas específicos de datos. Sistemas de Gestión de Bases de…
Productos relacionales y almacenamiento de datos Aquí están algunos de los principales productos de bases de datos relacionales que es posible que desee utilizar para el almacenamiento de datos. Casi todos estos proveedores han, durante los últimos años, adquirió productos adicionales,…
Estructura de base de datos y mysql MySQL es un sistema de gestión de bases de datos relacionales (RDBMS). El servidor MySQL puede manejar muchas bases de datos al mismo tiempo. De hecho, muchas personas pueden tener diferentes bases de datos gestionadas por un único servidor MySQL.…
Los componentes clave de Microsoft SQL Server El producto de Microsoft SQL Server se compone de cuatro componentes principales, tres de ellos siglas deportivos. Utilice esta lista para identificar los componentes de SQL Server y distinguirlos.Base de datos del motor: Esta parte de SQL Server en…