RDBMS en un entorno de datos grande

Gran datos se está convirtiendo en un elemento importante en la forma en las organizaciones están aprovechando de datos de gran volumen a la velocidad adecuada para resolver los problemas específicos de datos. Sistemas de Gestión de Bases de Datos Relacionales son importantes para este alto volumen. Big data no viven en aislamiento. Para ser eficaces, las empresas a menudo tienen que ser capaces de combinar los resultados de los análisis de datos grande con los datos que existe dentro de la empresa.

Conceptos básicos de datos grandes: los datos RDBMS y persistentes

Uno de los servicios más importantes que ofrece bases de datos operacionales (también llamado almacenes de datos) Es la persistencia. Persistencia garantiza que los datos almacenados en una base de datos no se modificarán sin permisos y que estará disponible todo el tiempo, ya que es importante para el negocio. ¿De qué sirve una base de datos si no se puede confiar para proteger los datos que pones en ella?

Teniendo en cuenta este importante requisito, entonces debe pensar en qué tipo de datos que desea persistir, ¿cómo se puede acceder y actualizar, y cómo se puede utilizar para tomar decisiones de negocio. En este nivel más fundamental, la elección de sus motores de bases de datos es fundamental para su éxito total con su aplicación de datos grande.

A pesar de que la tecnología subyacente ha sido de alrededor durante bastante tiempo, muchos de estos sistemas están en funcionamiento hoy en día porque las empresas que apoyan son altamente dependientes de los datos. Para reemplazarlos sería parecido a cambiar los motores de un avión en un vuelo transoceánico.

Conceptos básicos de datos grandes: RDBMS y mesas

Bases de datos relacionales están construidas sobre una o más relaciones y están representados por tablas. Estas tablas se definen por sus columnas, y los datos se almacenan en las filas. La clave principal es a menudo la primera columna de la tabla. La consistencia de la base de datos y gran parte de su valor se consigue mediante "la normalización" de los datos. Datos normalizados se ha convertido de formato nativo en un compartidas, acordada formato.

Por ejemplo, en una base de datos que pueda tener "teléfono" como XXX-XXX-XXXX mientras que en otra puede ser que sea XXXXXXXXX. Para lograr una visión consistente de la información, tendrá que ser normalizado a otra forma el campo. Existen cinco niveles de estándares para la normalización. La elección de la forma normal es a menudo relegada al diseñador de base de datos. La colección de mesas, llaves, elementos, y así sucesivamente se conoce como la base de datos esquema.

Con los años, el lenguaje de consulta estructurado (SQL) ha evolucionado al unísono con la tecnología RDBMS y es el mecanismo más utilizado para crear, consultar, mantener y operar las bases de datos relacionales.

En las empresas pequeñas y grandes, la mayoría de su información operativa importante es probablemente almacenada en RDBMS. Muchas compañías tienen diferentes RDBMS para diferentes áreas de su negocio. Los datos transaccionales pueden ser almacenados en la base de datos de un proveedor, mientras que la información del cliente se podría almacenar en otro.

No es probable que va a utilizar RDBMS para el núcleo de la aplicación, pero tendrá que depender de los datos almacenados en los RDBMS para crear el más alto nivel de valor para el negocio con grandes volúmenes de datos.

PostgreSQL, una base de datos relacional de código abierto

Durante su aplicación de datos grande, es probable que venir a través de PostgreSQL, una fuente abierta de base de datos relacional ampliamente utilizado. Varios factores contribuyen a la popularidad de PostgreSQL. Como un RDBMS con soporte para el estándar SQL, que hace todas las cosas que se esperan de un producto de base de datos, además de su longevidad y el uso de ancho han hecho "batalla probado." También está disponible en casi todas las variedades de sistema operativo, desde PCs a los mainframes.

Proporcionar los conceptos básicos y hacerlo de forma fiable son sólo parte de la historia. PostgreSQL también soporta muchas características que sólo se encuentran en los RDBMS propietaria costosa, incluyendo las siguientes:

  • Capacidad para manejar directamente "objetos" dentro del esquema relacional

  • Las claves externas (referencias claves de una tabla en otra)

  • Triggers (eventos utilizados para iniciar automáticamente un procedimiento almacenado)

  • Consultas complejas (subconsultas y se une a través de tablas discretas)

  • Integridad transaccional

  • Control de concurrencia multiversión

El verdadero poder de PostgreSQL es su extensibilidad. Los usuarios y los programadores de bases de datos pueden agregar nuevas capacidades sin afectar la operación fundamental o la fiabilidad de la base de datos. Extensiones posibles incluyen

  • Tipos de datos

  • Operadores

  • Funciones

  • Métodos de indexación

  • Lenguas de procedimiento

Este alto nivel de personalización hace PostgreSQL deseable cuando, productos patentados rígidos no hacer el trabajo. Es infinitamente extensible.

Por último, la licencia PostgreSQL permite la modificación y distribución en cualquier forma, de código abierto o cerrado. Las modificaciones se pueden mantener privados o compartidos con la comunidad como desee.




» » » » RDBMS en un entorno de datos grande