Cómo obtener oozie apache creó en hadoop

Apache Oozie está incluido en todas las distribuciones de Hadoop mayor, incluyendo Apache Bigtop. En el clúster Hadoop, instale el servidor Oozie en un nodo de borde, donde también se tendría que ejecutar otras aplicaciones cliente con los datos del cluster, como se muestra.

nodos de borde están diseñados para ser una puerta de entrada para la red exterior al clúster Hadoop. Esto las hace ideales para las tecnologías de transferencia de datos (Canal de flujo, por ejemplo), sino también las aplicaciones cliente y otra infraestructura de aplicaciones como Oozie. Oozie no necesita un servidor dedicado, y puede coexistir fácilmente con otros servicios que son ideales para los nodos de borde, como cerdo y Colmena.

Video: Hadoop || Apache OOZIE

Después Oozie se despliega, está listo para iniciar el servidor Oozie. la infraestructura de oozie se instala en el directorio $ OOZIE_HOME. A partir de ahí, ejecute el comando oozie-start.sh para iniciar el servidor. (Como es de esperar, detener el servidor consiste en tipificar oozie-stop.sh.) Puede comprobar el estado de la instancia Oozie ejecutando el comando

oozie administrador -status

Después de implementar el servidor Oozie y comenzó, se puede catalogar y administrar su flujo de trabajo diferentes, coordinador, o trabajos de paquete. Cuando se trabaja con sus puestos de trabajo, Oozie almacena las definiciones de catálogo - los datos que describen todos los objetos oozie (flujo de trabajo, coordinador, y el empleo de haces) -, así como sus estados en una base de datos dedicada.

Por defecto, Oozie está configurado para utilizar la base de datos Derby incorporada, pero se puede usar MySQL, Oracle o PostgreSQL, si es necesario.

Tiene cuatro opciones para interactuar con el servidor Oozie:

  • La API de Java: Esta opción es útil en situaciones en las que usted tiene su propio código de programación de aplicaciones Java, y que necesita para controlar la ejecución de los flujos de trabajo oozie, coordinadores, o haces dentro de su uso.

  • La API REST: Una vez más, esta opción funciona bien en los casos en que desea utilizar su propio código de programación como la base de sus flujos de trabajo oozie, coordinadores, o haces, o si usted quiere construir su propia interfaz o ampliar uno ya existente para administrar el servidor Oozie .

    Video: Apache Oozie - Quick start - Execute java main action

  • Interfaz de línea de comandos (CLI): Es la tradicional interfaz de línea de comandos de Linux para Oozie.

    Video: 32. Hadoop Administraion Tutorial - How to Configure Oozie HA (High Availability)

  • el Oozie Consola Web: Vale, puede que no se puede hacer mucho interactuar aquí, pero la consola Web Oozie le da una visión (sólo lectura) del estado del servidor Oozie, que es útil para el seguimiento de los trabajos de oozie.

Hue, una interfaz de administración Hadoop, proporciona otra herramienta para trabajar con Oozie. flujos de trabajo oozie, coordinadores, y los paquetes son definidos usando XML, que puede ser tedioso para editar, especialmente para situaciones complejas. Hue ofrece una herramienta de diseñador de interfaz gráfica de usuario para construir gráficamente los flujos de trabajo y otros objetos oozie.

Debajo de las cubiertas, Oozie incluye un servidor web Tomcat incorporado, que se encarga de su entrada y salida.

Artículos Relacionados