Flujos de trabajo en desarrollo oozie en hadoop

flujos de trabajo oozie son, en su núcleo, dirigidos gráficos, donde se pueden definir acciones (aplicaciones de Hadoop) y el flujo de datos, pero con sin loop - lo que significa que no se puede definir una estructura en la que había corrido una operación específica una y otra vez hasta que algún se cumple la condición (un bucle, por ejemplo).

Video: Hadoop Administration - 12 Setup Oozie

flujos de trabajo oozie son bastante flexibles en la que puede definir las decisiones basadas en la condición y senderos que se bifurcan para la ejecución en paralelo. También puede ejecutar una amplia gama de acciones.

Video: Deployment of Apache Oozie 4.1.0 on Hadoop Cluster in Azure Linux VM

En esta figura, se ve un flujo de trabajo que muestra las capacidades básicas de los flujos de trabajo oozie. En primer lugar, una secuencia de comandos se ejecuta cerdo, y es seguido inmediatamente por un árbol de decisión. Dependiendo del estado de la salida, el flujo de control puede ir directamente a un HDFS (Hadoop Distributed File System) operación de archivo (por ejemplo, una operación de copyToLocal) o para una acción tenedor.

Si el flujo de control pasa a la acción tenedor, dos puestos de trabajo se ejecutan simultáneamente: un trabajo MapReduce, y una consulta de la colmena. El flujo de control pasa entonces a la operación HDFS vez tanto el trabajo MapReduce y consulta Colmena terminado de ejecutar. Después de la operación HDFS, el flujo de trabajo se haya completado.

Video: Популярные Video – Apache Oozie и Hue

las definiciones de flujo de trabajo oozie están escritos en XML, basado en el esquema de Hadoop Proceso Definition Language (Formica). Este esquema particular es, a su vez, basado en el lenguaje XML Process Definition (XPDL) de esquema, que es un estándar independiente del producto para las definiciones de procesos de negocio de modelado.

Un flujo de trabajo Oozie se compone de una serie de acciones, que son codificadas por nodos XML. Hay diferentes tipos de nodos, que representan diferentes tipos de acciones o directivas de control de flujo. Cada flujo de trabajo Oozie tiene su propio archivo XML, donde se definen cada nodo y sus interconexiones.

los nodos de flujo de trabajo todos requieren identificadores únicos porque están utilizan para identificar el nodo siguiente a procesar en el flujo de trabajo. Esto significa que el orden en que se ejecutan las acciones depende de dónde nodo de una acción aparece en el flujo de trabajo XML. Para ver cómo se vería este concepto, echa un vistazo a la siguiente lista, que muestra un ejemplo de la estructura básica del archivo XML de un flujo de trabajo Oozie.

......"trabajo matado."

En este ejemplo, a un lado desde el principio, fin y matar a los nodos, tiene dos nodos de acción. Cada nodo de acción representa una aplicación o un comando de ser ejecutados.

Artículos Relacionados