Aplicaciones en tiempo real y streaming en hadoop

El flujo del proceso del hilado parece un montón, como un marco para la ejecución por lotes. Usted podría preguntarse, "? ¿Qué pasó con esta idea de la flexibilidad para los diferentes modos de aplicaciones " Bueno, el único marco de aplicación actualmente listo para su uso en producción es MapReduce. Pronto, el Apache Tez y Apache tormenta estarán listos para su uso en producción, y usted puede utilizar Hadoop para algo más que el procesamiento por lotes.

Tez, por ejemplo, apoyará tiempo real aplicaciones - una clase interactiva de aplicación donde el usuario espera una respuesta inmediata. Uno de los objetivos de diseño de Tez es proporcionar una instalación interactiva para que los usuarios emitir consultas Colmena y recibir un conjunto de resultados en pocos segundos o menos.

Otro ejemplo de un tipo no lote de aplicación es Storm, que puede analizar los datos de streaming. Este concepto es completamente diferente de cualquiera de MapReduce o Tez, ambos de los cuales operan con los datos que ya se conserva en el disco - en otras palabras, los datos en reposo. Tormenta procesa los datos que aún no se ha almacenado en el disco - más específicamente, los datos que se fluye en la red de una organización. Es de datos en movimiento, en otras palabras.

En ambos casos, los objetivos interactivos y de datos en streaming de procesamiento no funcionarían si Masters aplicación necesita ser instanciado, junto con todos los contenedores necesarios. Qué HILO permite aquí es el concepto de un servicio continuo (una sesión), donde hay un maestro aplicación dedicada que se mantiene vivo, esperando para coordinar las solicitudes. El Maestro aplicación también tiene arrendamientos abiertos en recipientes reutilizables para ejecutar todas las solicitudes a medida que llegan.




» » » » Aplicaciones en tiempo real y streaming en hadoop