Scripting con latín de cerdo en hadoop

Video: CAMBIÓ SUS MANOS POR PATAS DE CERDO

Hadoop es un ecosistema rico y rápida evolución de un conjunto cada vez mayor de nuevas aplicaciones. En lugar de tratar de mantenerse al día con todos los requisitos para las nuevas capacidades, cerdo está diseñado para ser extensible a través de funciones definidas por el usuario, también conocido como UDF.

Video: Banda la Trakalosa - Un Par de Cerdos (Video Oficial)

UDF se pueden escribir en varios lenguajes de programación, incluyendo Java, Python y javascript. Los desarrolladores también están publicando y compartiendo una colección cada vez mayor de las UDF en línea. (Busque hucha y DataFu, por citar sólo dos ejemplos de este tipo de colecciones en línea.) Algunos de cerdo UDF que forman parte de estos depósitos son funciones de carga / almacenamiento (XML, por ejemplo), las funciones de fecha y hora, texto, matemáticas, y las estadísticas funciones.

Pig también se pueden incrustar en los lenguajes principales tales como Java, Python y javascript, lo que le permite integrar cerdo con las aplicaciones existentes. También ayuda a superar las limitaciones en el lenguaje de cerdo. Una de las limitaciones más comúnmente se hace referencia es el cerdo no es compatible con los estados de flujo de control: if / else, while bucle, bucle, y condición.

Video: Como criar cerdos. Porcicultura en el tropico

Cerdo soporta de forma nativa el flujo de datos, pero necesita ser incrustado dentro de otro idioma para proporcionar un flujo de control. Hay ventajas y desventajas, sin embargo, la incorporación de cerdo en un lenguaje de flujo de control. Por ejemplo, si una declaración de cerdo está incrustado en un bucle, cada vez que se repite el bucle y se ejecuta la instrucción de cerdo, esto provoca un trabajo independiente para ejecutar MapReduce.

Artículos Relacionados