Configuración de flujos de trabajo oozie

Como un motor de flujo de trabajo, Oozie permite ejecutar un conjunto de aplicaciones de Hadoop en una secuencia específica conocida como flujo de trabajo. Puede configurar los flujos de trabajo oozie en una de tres maneras, dependiendo de sus circunstancias particulares. Puedes usar

  • El archivo config-default.xml: Define los parámetros que no cambian para el flujo de trabajo.

  • los job.properties archivo: Define los parámetros que son comunes para una implementación particular del flujo de trabajo. Definiciones aquí anulan los realizados en el archivo config-default.xml.

  • los parámetros de línea de comando: Define los parámetros que son específicos para la invocación del flujo de trabajo. Definiciones aquí anulan los realizados en el archivo job.properties y el archivo config-default.xml.

Los detalles de configuración serán diferentes, dependiendo de la acción que están asociados. Por ejemplo, como se puede ver en la acción MapReduce (mapa-acción) en el listado siguiente, usted tiene muchas más cosas para configurar allí:

... @@1 serverName: 8021serverName: 8020 @@2 @@3 jobConfig.xml...mapreduce.map.classdummies.oozie.FlightMilesMappermapreduce.reduce.classdummies.oozie.FlightMilesReducer mapred.mapoutput.key.classorg.apache.hadoop.io.Textmapred.mapoutput.value.classorg.apache.hadoop.io.IntWritablemapred.output.key.classorg.apache.hadoop.io.Textmapred.output.value.classorg.apache.hadoop.io.IntWritablemapred.input.dir'/ usr / daga / FlightData'mapred.output.dir'/ usr / daga / flightmiles'......

A diferencia de un sistema de archivos (fs) acción como la que se muestra aquí:

......



» » » » Configuración de flujos de trabajo oozie