Apache hadoop y bigtop

Para ayudarle a empezar con Hadoop, aquí están las instrucciones sobre cómo descargar rápidamente y configurar Hadoop en su propio ordenador portátil. El clúster se ejecuta en modo pseudo-distribuido en una máquina virtual, por lo que no se necesita hardware especial.

UN máquina virtual (VM) es un ordenador simulado que se puede ejecutar en un ordenador real. Por ejemplo, puede ejecutar un programa en su ordenador portátil que “juega” una máquina virtual, lo que abre una ventana que parece que se está ejecutando en otro equipo. En efecto, un equipo de simulación se ejecuta dentro de su ordenador real.

Se le descargando una máquina virtual, y mientras se ejecuta, te instala Hadoop.

Video: Apache Bigtop, a crash course in deploying a Hadoop bigdata - Roman Shaposhnik, Konstantin Boudnik

Apache Bigtop es una gran alternativa si desea montar sus propios componentes de Hadoop. Bigtop reúne los componentes de la base de Hadoop para usted y asegura que su configuración funciona. Apache Bigtop es una distribución de código abierto 100 por ciento.

El objetivo principal de Bigtop - sí mismo un proyecto Apache, al igual que Hadoop - es construir una comunidad alrededor de los envases, la implementación y la integración de los proyectos en el ecosistema Apache Hadoop. La atención se centra en el sistema en su conjunto y no en proyectos individuales.

Usando Bigtop, puede instalar fácilmente y desplegar componentes de Hadoop sin tener que rastrearlos en una distribución específica y combinar con una versión específica de Hadoop. A medida que se liberan nuevas versiones de componentes de Hadoop, que a veces no funcionan con las versiones más recientes de otros proyectos. Si usted está en su propia, se requiere una prueba significativa.

Con Bigtop (o una versión comercial de Hadoop) se puede confiar en que los expertos de Hadoop han hecho esta prueba para usted. Para darle una idea de cómo Bigtop expansiva ha conseguido, consulte la siguiente lista de todos los componentes incluidos en Bigtop:

  • Apache Crunch

    Video: Deploying Hadoop-Based Big Data Environments by Roman Shaposhnik (Apache Big Top)

  • Apache Flume

    Video: Apache Hadoop Crash Course

  • Apache Giraph

  • Apache HBase

    Video: Apache Hadoop YARN Past Present and Future

  • Apache HCatalog

  • Apache Hive

  • Apache Mahout

  • Apache Oozie

  • Apache Pig

  • Apache Solr

  • Apache Sqoop

  • Apache Runrunear

  • Apache Zookeeper

  • cloudera Hue

  • LinkedIn DataFu

Esta colección de proyectos de ecosistemas Hadoop es casi tan amplia como se pone, como se incluyen dos proyectos mayores y menores. Apache Bigtop está en continua evolución.

Artículos Relacionados