Capa 2 de la gran pila de datos: bases de datos operacionales

En el núcleo de cualquier entorno de datos grande, y la capa 2 de la gran pila de datos, son los motores de bases de datos que contienen las colecciones de elementos de datos relevantes para su negocio. Estos motores tienen que ser rápido, escalable y sólida como una roca. No son todos iguales, y ciertos entornos de datos grandes tendrán mejores resultados con un motor que otro, o más probablemente con una mezcla de los motores de bases de datos.

Video: Estructuras de Datos – 9. Pilas en C (COMPLETO)

Por ejemplo, aunque es posible utilizar sistemas de gestión de bases de datos relacionales (RDBMS) para todos sus grandes implementaciones de datos, no es práctico hacerlo a causa de rendimiento, escala, o incluso el costo. Una serie de diferentes tecnologías de bases de datos están disponibles, y usted debe tener cuidado de elegir sabiamente.

No existe una sola opción correcta con respecto a los idiomas de bases de datos. Aunque SQL es el lenguaje más frecuente de consulta de base de datos en uso hoy en día, otros idiomas puede proporcionar una manera más eficaz o eficiente de resolver los grandes desafíos de datos. Es útil pensar en los motores e idiomas como herramientas en una “caja de herramientas del implementador.” Su trabajo es elegir la herramienta adecuada.

Video: Estructura de Datos-Pilas

Por ejemplo, si se utiliza un modelo relacional, es probable que utilice SQL para consultar la misma. Sin embargo, también se puede utilizar lenguajes alternativos como Python o Java. Es muy importante entender qué tipos de datos pueden ser manipulados por la base de datos y si es compatible con cierto comportamiento transaccional. los diseñadores de bases de datos describen este comportamiento con el acrónimo ÁCIDO. Lo que representa

  • Atomicidad: Una transacción es “todo o nada” cuando es atómica. Si alguna parte de la transacción o el sistema subyacente falla, toda la transacción falla.

  • Consistencia: Sólo las transacciones con datos válidos se llevarán a cabo en la base de datos. Si los datos son corruptos o inadecuada, la transacción no se completará y los datos no se escribirá en la base de datos.

  • Aislamiento: , transacciones simultáneas múltiples no interferirán entre sí. Todas las transacciones válidas se ejecutará hasta completarse y en el orden en que fueron enviadas para su procesamiento.

  • Durabilidad: Después de que los datos de la transacción se escriben en la base de datos, se queda allí “para siempre.”

    MotorLenguaje de consultaMapa reducidoTipos de datosActasEjemplos
    RelacionalSQL, Python, CNomecanografiadoÁCIDOPostgreSQL, Oracle, DB / 2
    De columnaRubíHadoopPredefinidos y mecanografiadoSí, si está habilitadoHBase
    GraficoCaminar, Buscar, CypherNosin tipoÁCIDONeo4J
    DocumentocomandosjavascriptmecanografiadoNoMongoDB, CouchDB
    Valor claveLucene, ComandosjavascriptBLOB, semitypedNoRiak, Redis

Video: Curso: Algoritmos y Estructura de Datos - Pilas (Stacks)

Después de comprender sus necesidades y entender lo que está reuniendo datos, dónde ponerlo, y qué hacer con él, es necesario organizarlo de forma que pueda ser consumida por el análisis, la presentación de informes o aplicaciones específicas.

Artículos Relacionados