RDBMS en un entorno de grandes volúmenes de datos

grandes volúmenes de datos se está convirtiendo en un elemento importante en el camino organizaciones están aprovechando grandes volúmenes de datos a la velocidad adecuada para resolver problemas específicos de datos. Base de datos relacional sistemas de gestión son importantes para este alto volumen. grandes volúmenes de datos no vive en aislamiento. Para ser eficaces, las empresas a menudo tienen que ser capaces de combinar los resultados del análisis de grandes volúmenes de datos con los datos que existe dentro de la empresa.

fundamentos de grandes datos: datos de RDBMS y persistentes

Uno de los servicios más importantes que ofrece bases de datos operacionales (también llamados almacenes de datos) Es la persistencia. Persistencia garantiza que los datos almacenados en una base de datos no serán cambiados sin permisos y que estará disponible todo el tiempo, ya que es importante para el negocio. ¿De qué sirve una base de datos si no se puede confiar para proteger los datos que pone en él?

Teniendo en cuenta este requisito más importante, entonces debe pensar en qué tipo de datos que desea persistir, ¿cómo se puede acceder y actualizar, y cómo se puede utilizar para tomar decisiones de negocio. En este nivel más fundamental, la elección de los motores de bases de datos es fundamental para su éxito total con su aplicación de datos grande.

A pesar de que la tecnología subyacente ha sido de alrededor durante bastante tiempo, muchos de estos sistemas están en operación hoy en día porque las empresas que apoyan son dependientes de los datos altamente. Para reemplazarlos serían similares a los cambios de los motores de un avión en un vuelo transoceánico.

fundamentos de datos grandes: RDBMS y mesas

bases de datos relacionales se basan en una o más relaciones y están representados por tablas. Estas tablas se definen por sus columnas, y los datos se almacenan en las filas. La clave principal es a menudo la primera columna de la tabla. La consistencia de la base de datos y mucho de su valor se logra mediante la normalización de “” los datos. Los datos normalizados se ha convertido de formato nativo en una compartida, acordado formato.

Por ejemplo, en una base de datos que pueda tener “teléfono”, como XXX-XXX-XXXX mientras que en otra podría ser XXXXXXXXX. Para lograr una visión consistente de la información, tendrá que ser normalizado a otra forma el campo. Existen cinco niveles de estándares para la normalización. La elección de la forma normal, es a menudo relegada al diseñador de la base de datos. La colección de tablas, claves, elementos, y así sucesivamente se conoce como la base de datos esquema.

Con los años, el lenguaje de consulta estructurado (SQL) ha evolucionado al unísono con la tecnología RDBMS y es el mecanismo más utilizado para crear, consultar, mantener y operar las bases de datos relacionales.

Video: Bases de datos (Teoría y SQL)

En las empresas pequeñas y grandes, la mayoría de su información importante de operación es, probablemente almacena en los RDBMS. Muchas empresas tienen diferentes RDBMS para diferentes áreas de su negocio. Los datos transaccionales pueden ser almacenados en la base de datos de un proveedor, mientras que la información del cliente se podría almacenar en otro.

No es probable que va a utilizar los RDBMS para el núcleo de la aplicación, pero tendrá que confiar en los datos almacenados en los RDBMS para crear el más alto nivel de valor para el negocio con grandes volúmenes de datos.

PostgreSQL, una base de datos relacional de código abierto

Durante su aplicación de datos grande, es probable que venir a través PostgreSQL, un ampliamente utilizado, de código abierto base de datos relacional. Varios factores contribuyen a la popularidad de PostgreSQL. Como un RDBMS con soporte para el estándar SQL, que hace todas las cosas que se esperan de un producto de base de datos, además de su longevidad y su amplio uso han hecho que sea “a prueba de batalla.” También está disponible en casi todas las variedades de sistema operativo, desde PCs a unidades de proceso.

Video: base de datos relacionales

Proporcionar los conceptos básicos y hacerlo de forma fiable son sólo parte de la historia. PostgreSQL también soporta muchas características que sólo se encuentran en la cara RDBMS patentada, incluidos los siguientes:

Capacidad para manejar directamente “objetos” dentro del esquema relacional
Las claves externas (referencias claves de una tabla en otra)
Disparadores (eventos utilizados para iniciar automáticamente un procedimiento almacenado)
Las consultas complejas (subconsultas y se une a través de tablas discretas)
integridad transaccional
control de concurrencia multiversión

Video: 1. Bases de datos relacionales I

El poder real de PostgreSQL es su extensibilidad. Los usuarios y los programadores de bases de datos pueden agregar nuevas capacidades sin afectar la operación fundamental o fiabilidad de la base de datos. Posibles extensiones incluyen

Tipos de datos
operadores
funciones
métodos de indexación
lenguajes procedimentales

Este alto nivel de personalización hace que PostgreSQL deseable cuando rígidos, productos patentados no conseguirá el trabajo hecho. Es infinitamente extensible.

Por último, la licencia PostgreSQL permite la modificación y distribución en cualquier forma, de código abierto o cerrado. Todas las modificaciones se pueden mantener privados o compartidos con la comunidad como desee.