Programación y oozie coordinación de flujos de trabajo en hadoop

Después de crear un conjunto de flujos de trabajo, puede utilizar una serie de puestos de trabajo de coordinador oozie para programar cuando son ejecutados. Usted tiene dos opciones de programación para la ejecución: un tiempo específico y la disponibilidad de los datos en relación con un determinado tiempo.

Programación basada en el tiempo de empleo coordinador oozie

Empleo coordinador oozie se pueden programar para ejecutar en un momento determinado, pero después de que se inició, que pueden ser configurados para ejecutarse a intervalos especificados. El siguiente ejemplo muestra un trabajo coordinador que comienza a correr a una hora de inicio especificada y fecha:

...$ {workflowAppPath}

Programación basada en la disponibilidad de tiempo y los datos de empleo coordinador oozie

Empleo coordinador oozie también se pueden programar para ejecutar en un momento determinado si los archivos o directorios de datos especificados están disponibles. El siguiente listado muestra un ejemplo de un coordinador que comienza a correr a una hora de inicio y la fecha especificada, se ejecuta una vez al día si existe el conjunto de datos identificado por triggerDatasetDir, y se prolongará hasta la hora de finalización especificada:

...$ {triggerDatasetDir}$ {horaInicio}$ {workflowAppPath}

Ejecución de empleo coordinador oozie

Al igual que en los trabajos de flujo de trabajo oozie, empleo coordinador requieren un archivo job.properties, y el archivo coordinator.xml necesita ser cargado en el HDFS. Para ejecutar un trabajo de coordinador Oozie desde la interfaz de línea de comandos Oozie, emitir un comando como el siguiente garantizando al mismo tiempo que el archivo job.properties es accesible a nivel local:

$ Job oozie -config sampleCoordinator / job.properties -run

Después de enviar el trabajo, el coordinador se almacena en la base de datos de objetos Oozie. En la presentación, Oozie devuelve un identificador para que pueda controlar y administrar su coordinador - empleo: 0.000.001-00000001234567-oozie-C.

Para comprobar el estado de este trabajo, ejecute el comando

trabajo oozie -info 0000001-00000001234567-oozie-C



» » » » Programación y oozie coordinación de flujos de trabajo en hadoop