Horizontal frente a la gestión de almacenamiento de datos verticales

La mayoría de los administradores de bases de datos relacionales se han construido sobre una gestor de almacenamiento horizontal, que coloca todos los datos en una base de datos por fila (o registro) cuando se produce una transacción. Una tabla de base de datos se representa como una cadena de páginas de bases de datos que contienen una o más filas de datos.

Un gestor de almacenamiento horizontal proporciona soporte rápido procesamiento de transacciones en línea (OLTP), ya que la mayoría de las transacciones se realizan en un formato de registro - por ejemplo, la inserción de una entrada de libro mayor o escribir un cheque. Sin embargo, cuando un usuario solicita un registro, la página de la base de datos que contiene los datos a menudo se trasladó a la memoria, que para aplicaciones de inteligencia de negocios es altamente ineficiente.

Varios productos de bases de datos especializadas han surgido en los últimos años diseñados para ayudar y optimizar las aplicaciones de consulta centrado, como la inteligencia empresarial. Tales productos le permiten desarrollar más fácilmente los almacenes de datos interactivas. El objetivo de estas bases de datos por columnas es aumentar la velocidad de las consultas de apoyo a las decisiones realizadas en contra de grandes cantidades de datos.

Video: LOGÍSTICA Y ALMACENAMIENTO

Cuando se pide a los administradores de bases de datos si alguna vez colocar un índice en una columna que contiene el código de una persona zona, el promedio de calificaciones de un estudiante, o el total de transacciones de un cliente, responden con un rotundo “¡No!” Suelen dar esta respuesta inflexible por razones basadas en la tecnología, tales como:

  • Nos índice basado sólo en las trayectorias estándar, bien conocidos (como el nombre) a causa de la sobrecarga de índices.

  • los cardinalidad, o la ocurrencia única de datos, obligaría a la base de datos para realizar un recorrido de tabla de todos modos.

Video: Almacenamiento

Sin embargo, cuando se pregunta a los usuarios la información que necesitan para cumplir con sus responsabilidades de trabajo, responden a este tipo de requisitos:

  • Ver el número de personas por el código de área en mi territorio para que pueda gestionar más eficazmente mis promociones.

  • Identificar los estudiantes mejor clasificados en la clase de graduación, así que puedo arreglar las entrevistas adecuadas.

  • Averiguar qué clientes hacer negocios con mi compañía y gastar entre $ 100.000 y $ 500.000 al año.

Cada uno de estos tres requisitos caracteriza a una petición de usuario diferente, pero todos ellos realizan funciones similares: Son preguntas de la ayuda orientada a la toma. Una necesidad de acceder a los datos impulsa requisitos de información de los usuarios, pero los patrones de acceso de los usuarios no son compatibles con la mayoría de las estrategias de indexación de RDBMS. En resumen, la tecnología RDBMS se interpone en el camino del éxito de las aplicaciones.

Una tabla de base de datos se representa como una cadena de páginas de bases de datos que contienen una o más filas de datos, como se muestra en esta figura. Un gestor de almacenamiento horizontal proporciona soporte rápido procesamiento de transacciones en línea (OLTP), ya que la mayoría de las transacciones se realizan en un formato de registro.

Estas bases de datos relacionales ayudan actividad de consulta mediante el uso de índices. Los índices se construyen en la parte superior de las filas para simplificar y acelerar la recuperación de datos en los caminos comunes, como se muestra en la figura.

Video: Almacén vertical Modula para el distribuidor industrial Lasaulec [Países Bajos]

soluciones de almacenamiento de datos, tales como inteligencia de negocios, no utilizan muchas de estas técnicas de indexación, ya que han sido diseñados para ayudar a las aplicaciones OLTP en la frecuente necesidad de encontrar y actualizar filas individuales dentro de las tablas de bases de datos.

Para apoyar adecuadamente consultas de los usuarios típicos que se encuentran en la inteligencia de negocio, se requieren otras técnicas de almacenamiento e indexación. Proveedores como Sybase y Vertica han construido los administradores de almacenamiento verticales. En lugar de almacenar los datos por fila, estos productos almacenan los datos por columnas - de ahí el nombre gestor de almacenamiento vertical o almacenamiento por columnas.

Video: equipos de almacenamiento

Este método de almacenamiento resuelve eficazmente el problema de consultas de los usuarios en contra de grandes conjuntos de datos, ya que un usuario busca a menudo sólo unas pocas columnas, en comparación con el gran número de columnas gestionados en una fila por un gestor de almacenamiento horizontal. Con los datos almacenados como una serie de cambios de página, con cada página que contiene datos de la columna, el tiempo de procesamiento de consultas se reduce por un factor de 500 o más a 1.

Además, estos productos son compatibles con otras optimizaciones que ayudan en la velocidad de procesamiento de la consulta, incluyendo la compresión de datos, operaciones de consulta en paralelo, y múltiples técnicas de indexación por columna. El reto en la implementación de estas tecnologías implica la estandarización. Por lo tanto, muchos departamentos de gestión de datos se niegan a aplicar esas tecnologías porque esas tecnologías requieren mano de obra apoyo adicional.

Artículos Relacionados