Secuencias de comandos con el cerdo latino en hadoop

Hadoop es un ecosistema rico y evolucionando rápidamente con un conjunto cada vez mayor de nuevas aplicaciones. En lugar de tratar de mantenerse al día con todos los requisitos para nuevas capacidades, cerdo está diseñado para ser extensible a través de funciones definidas por el usuario, también conocido como UDF.

UDF pueden ser escritos en varios lenguajes de programación, incluyendo Java, Python y javascript. Los desarrolladores también están publicando y compartiendo una creciente colección de UDF en línea. (Busque Piggy Bank y DataFu, por citar sólo dos ejemplos de este tipo de colecciones en línea.) Algunas de las UDF de cerdo que son parte de estos repositorios son funciones Load / Store (XML, por ejemplo), las funciones de fecha y hora, texto, matemáticas, y estadísticas funciones.

Pig también puede ser embebido en los lenguajes principales tales como Java, Python y javascript, lo que le permite integrar Cerdo con las aplicaciones existentes. También ayuda a superar las limitaciones en el idioma Pig. Una de las limitaciones que se hace referencia más comúnmente es que Pig no admite los estados de flujo de control: if / else, while loop, bucle, y de condición.

Cerdo soporta nativamente flujo de datos, pero necesita ser incrustado dentro de otro idioma para proporcionar un flujo de control. Hay ventajas y desventajas, sin embargo, de la incorporación de cerdo en un lenguaje de control de flujo. Por ejemplo, si una declaración de cerdo está incrustado en un bucle, cada vez que se repite el bucle y se ejecuta la declaración de cerdo, esto provoca un trabajo MapReduce independiente para ejecutar.

Sobre el autor

Cerdo latino en los programas de cerdo de Hadoop

Cerdo latín es el idioma para programas de cerdo. Cerdo traduce el guión Pig Latin en puestos de trabajo MapReduce que pueda ser ejecutado dentro del clúster Hadoop. Si viene con cerdo América, el equipo de desarrollo sigue tres principios…

Guión cerdo interactúa en hadoop

El lenguaje de programación cerdo está diseñado para manejar cualquier tipo de datos arrojó su camino - estructurada, semiestructurada, los datos no estructurados, lo que sea. Programas de cerdo puede ser envasados en tres formas…

El ecosistema Hadoop de Apache

Hadoop es más de MapReduce y HDFS (Hadoop Distributed File System): Es también una familia de proyectos relacionados (un ecosistema, en realidad) para la computación distribuida y el procesamiento de datos a gran escala. La mayoría (pero no…

La arquitectura de la colmena apache

Al examinar los elementos de Apache Hive muestran, se puede ver en la parte inferior que la colmena se sienta encima del Sistema Hadoop Distributed File (HDFS) y sistemas de MapReduce.En el caso de MapReduce, los figureshows tanto los componentes 1…

El ecosistema de clientes HBase

HBase está escrito en Java, un lenguaje elegante para la construcción de tecnologías distribuidas como HBase, pero la cara él - no todo el mundo que quiera aprovechar las innovaciones HBase es un desarrollador Java. Es por eso que hay un rico…

Su primer programa hadoop: hola Hadoop!

Después de que el clúster Hadoop está instalado y en funcionamiento, puede ejecutar su primer programa de Hadoop. Esta aplicación es muy sencilla, y calcula el total de millas voladas para todos los vuelos realizados en un año. El año está…

Holandés horno asado de cerdo tomillo

¿Qué es un asado de carne de cerdo? Casi cualquier corte unsliced del cerdo. Para esta receta hecha en un horno holandés, consiga un lomo de cerdo asado de fin. Si prefiere un corte sin hueso, utilice cortante en el centro de cerdo…

Chuletas de cerdo melocotón-esmaltado

Fruta y cerdo son un dúo delicioso. Cuando melocotones frescos están en temporada, pelar y cortar dos grandes melocotones frescos para esta receta de costilla de cerdo. De lo contrario, utilice rebanadas de durazno congelado.Tiempo de…

Carnitas norte & # 241-as

Este carnitas Norte # 241, como receta incluye trozos de cerdo a fuego lento lentamente en grasa. Carnitas Norte # 241, como son deliciosos en tacos o burritos, o acompañado con frijoles y arroz.Tiempo de preparación: 10 minutosHora de cocinar: 1…

Paleo receta de la dieta: cerdo olla de cocción lenta y chucrut

Se puede comer como un (civilizada) hombre de las cavernas con esta receta para un solo recipiente plato Paleo: cerdo cocina lenta y chucrut. El secreto de este deleitó Paleo es para dorar la carne de cerdo antes de añadir el chucrut. Servir con…

Lomo de cerdo asado con verduras

Solomillo de cerdo es una gran alternativa magra de proteínas a la cena estándar de pollo, y contiene mucha menos grasa saturada que muchos cortes de carne. Este plato de lomo de cerdo dura 10 minutos de tiempo de preparación y 45 minutos para…

Cómo negociar panceta de cerdo congeladas en la bolsa de materias primas

En esencia, el término vientres de cerdo es manera de decir el tocino los comerciantes de productos básicos. Físicamente, panceta de cerdo provienen de la parte inferior de un cerdo y pesan aproximadamente 12 libras. Estos panceta de cerdo en…

maniqui-es.com » Computadoras y software » Big Data » Gestión de datos » Secuencias de comandos con el cerdo latino en hadoop