Construir una base de datos grande con el ecosistema hadoop

Video: Hadoop (осень 2014)

Como componentes básicos, Hadoop MapReduce y HDFS se están mejorando constantemente y proporcionan puntos de partida para grandes volúmenes de datos, pero se necesita algo más. Tratando de hacer frente a grandes desafíos de datos sin una caja de herramientas llena de tecnología y servicios es como tratar de vaciar el océano con una cuchara. El ecosistema Hadoop ofrece una colección cada vez mayor de tecnologías y herramientas creadas para suavizar el desarrollo, implementación y soporte de soluciones de datos grandes.

Video: Big Data Hadoop Tutorial Videos

Ningún edificio es estable, sin cimientos. Aunque es importante, la estabilidad no es el único criterio importante en un edificio. Cada parte del edificio debe ser compatible con su propósito general. Las paredes, pisos, escaleras, instalaciones eléctricas, hidráulicas, y el techo deben complementarse entre sí mientras que confían en las bases de apoyo y la integración. Es lo mismo con el ecosistema Hadoop.

El fundamento es MapReduce y HDFS. Ellos proporcionan los servicios básicos de la estructura y de integración necesarias para soportar los requisitos básicos de las soluciones de datos grandes. El resto del ecosistema proporciona los componentes necesarios para construir y gestionar aplicaciones de datos grandes, dirigidas a objetivos para el mundo real.

Video: Scale R to Big Data Using Hadoop and Spark - Phuc H Duong

En ausencia del ecosistema sería incumbe a los desarrolladores, administradores de bases de datos, el sistema y los administradores de red, y otros para identificar y ponerse de acuerdo sobre un conjunto de tecnologías para construir y desplegar soluciones de datos grandes. Esto es a menudo el caso cuando las empresas quieren adaptar nuevas y emergentes tendencias de la tecnología.

La tarea de improvisar tecnologías en un nuevo mercado es desalentadora. Es por ello que el ecosistema Hadoop es tan fundamental para el éxito de grandes volúmenes de datos. Es la colección más completa de herramientas y tecnologías disponibles en la actualidad para apuntar grandes desafíos de datos. El ecosistema de facilitar la creación de nuevas oportunidades para la adopción generalizada de grandes volúmenes de datos de empresas y organizaciones.

Artículos Relacionados