¿Cómo obtener oozie apache creó en hadoop

Apache Oozie está incluido en todas las distribuciones de Hadoop importante, incluyendo Apache Bigtop. En el clúster Hadoop, instale el servidor Oozie en un nodo de borde, donde usted también ejecutar otras aplicaciones de cliente con los datos del cluster, como se muestra.

imagen0.jpg

Nodos de borde están diseñados para ser una puerta de entrada para la red externa al clúster Hadoop. Esto las hace ideales para las tecnologías de transferencia de datos (Flume, por ejemplo), sino también las aplicaciones de cliente y otras infraestructuras aplicación como Oozie. Oozie no necesita un servidor dedicado, y puede coexistir fácilmente con otros servicios que son ideales para los nodos de borde, como cerdo y Colmena.

Después Oozie se despliega, ya está listo para iniciar el servidor Oozie. La infraestructura de Oozie se instala en el directorio $ OOZIE_HOME. A partir de ahí, ejecute el comando oozie-start.sh para iniciar el servidor. (Como es de esperar, detener el servidor implica escribir oozie-stop.sh.) Puede comprobar el estado de la instancia Oozie ejecutando el comando

administrador oozie -status

Una vez que haya el servidor Oozie desplegado e iniciado, puede catalogar y administrar su flujo de trabajo diferentes, coordinador, o trabajos de paquete. Cuando se trabaja con sus puestos de trabajo, Oozie almacena las definiciones de catálogo - los datos que describen todos los objetos oozie (flujo de trabajo, coordinador, y el empleo de haces) -, así como sus estados en una base de datos dedicada.

Por defecto, Oozie está configurado para utilizar la base de datos Derby incorporado, pero se puede usar MySQL, Oracle o PostgreSQL, si es necesario.

Usted tiene cuatro opciones para interactuar con el servidor Oozie:

  • La API de Java: Esta opción es útil en situaciones en las que usted tiene su propio código de programación de aplicaciones Java, y que necesita para controlar la ejecución de los flujos de trabajo oozie, coordinadores, o haces desde su aplicación.

  • La API REST: Una vez más, esta opción funciona bien en aquellos casos en que desea utilizar su propio código de programación como la base de sus flujos de trabajo oozie, coordinadores, o paquetes, o si usted quiere construir su propia interfaz o ampliar uno ya existente para administrar el servidor Oozie .

  • Command Line Interface (CLI): Es la tradicional interfaz de línea de comandos de Linux para Oozie.

  • El Oozie Consola Web: Bueno, tal vez no se puede hacer mucho interactuando aquí, pero la consola Web Oozie le da una (de sólo lectura) vista del estado del servidor Oozie, que es útil para el seguimiento de los trabajos de oozie.

    image1.jpg

Hue, una interfaz de administración Hadoop, proporciona otra herramienta para trabajar con Oozie. Flujos de trabajo oozie, coordinadores y paquetes están definidos usando XML, que puede ser tedioso para editar, especialmente para situaciones complejas. Hue ofrece una herramienta de diseño GUI para construir gráficamente los flujos de trabajo y otros objetos oozie.

Debajo de las sábanas, Oozie incluye un servidor incrustado web Tomcat, que se ocupa de su entrada y salida.




» » » » ¿Cómo obtener oozie apache creó en hadoop