Las bases de datos del gráfico en un entorno de datos grande

La estructura fundamental de las bases de datos del gráfico de datos grande se llama " ganglios relación ". Esta estructura es más útil cuando hay que tratar con datos altamente interconectados. Los nodos y relaciones de apoyo propiedades, un par clave-valor, donde se almacenan los datos.

Estas bases de datos se puede navegar siguiendo las relaciones. Este tipo de almacenamiento y la navegación no es posible en los RDBMS (sistemas de gestión de base de datos relacional), debido a las estructuras de tablas rígidas y la incapacidad de seguir las conexiones entre los datos donde quiera que nos podrían llevar. Una base de datos gráfica podría ser utilizado para administrar los datos geográficos para la exploración de petróleo o de modelar y optimizar las redes de un proveedor de telecomunicaciones.

Una de las bases de datos del gráfico más ampliamente utilizados es Neo4J. Es un proyecto de código abierto con licencia en virtud de la v3.0 licencia pública GNU. A, versión comercial apoyado es proporcionada por Neo Technology bajo la GNU v3.0 AGPL y licencia comercial.

Neo4J es una base de datos de transacciones ACID ofreciendo alta disponibilidad a través de la agrupación. Es una base de datos confiable y escalable que es fácil de modelar debido a la estructura fundamental de las propiedades de nodos de relación y la forma natural se asigna a nuestras relaciones humanas. No requiere de un esquema, ni requiere de tipos de datos, por lo que es de por sí muy flexible.

Con esta flexibilidad viene algunas limitaciones. Los nodos no pueden hacer referencia a ellos directamente. Por ejemplo, usted (como un nodo) no puede ser también tu propio padre o la madre (como las relaciones), pero puede ser la el padre o la madre. Puede haber casos del mundo real donde se requiere la auto-referencia.

Si es así, una base de datos gráfica no es la mejor solución, ya que las reglas acerca de la auto-referencia se aplican estrictamente. Mientras que la capacidad de replicación es muy buena, Neo4J sólo puede replicar gráficos enteras, colocando un límite en el tamaño total de la gráfica (aproximadamente 34 millones de nodos y 34 mil millones de relaciones).

Las características importantes de Neo4J incluyen los siguientes:

  • La integración con otras bases de datos: Neo4J apoya la gestión de transacciones con rollback para permitir la interoperabilidad con los almacenes de datos no gráficos.

  • Servicios de sincronización: Neo4J apoya comportamientos basados ​​en eventos a través de un bus de eventos, sincronización periódica utilizando en sí, o un RDBMS como el maestro, y la sincronización de lotes tradicional.

  • Resiliencia: Neo4J admite copias de seguridad en frío (es decir, cuando la base de datos no se está ejecutando) y calientes (cuando se está ejecutando), así como un modo de clustering de alta disponibilidad. Alertas estándar están disponibles para la integración con sistemas de gestión de las operaciones existentes.

  • Lenguaje de consulta: Neo4J soporta un lenguaje declarativo llamado Cypher, diseñado específicamente para consultar gráficos y sus componentes. Comandos Cypher se basan libremente en la sintaxis SQL y están dirigidos a consultas ad hoc de los datos del gráfico.

Implementaciones Neo4j son los más adecuados para

  • Redes Sociales

  • Clasificación de los dominios biológicos o médicos

  • Creación de comunidades dinámicas de la práctica o de interés




» » » » Las bases de datos del gráfico en un entorno de datos grande