Escritura de cerdo interfaces en hadoop

El lenguaje de programación cerdo está diseñado para manejar cualquier tipo de datos lanzaron su camino - estructurada, semiestructurada, los datos no estructurados, lo que sea. programas de cerdo se pueden envasar en tres formas diferentes:

  • Guión: Este método no es más que un archivo que contiene los comandos de Latín de cerdo, identificado por el sufijo .pig (FlightData.pig, por ejemplo). La cancelación de su programa de cerdo con la extensión .pig es una convención, pero no es necesario. Los comandos son interpretados por el compilador latín de cerdo y se ejecutan en el orden determinado por el optimizador de cerdo.

  • Gruñido: Ronco actúa como un intérprete de comandos de forma interactiva donde se puede entrar en latín de cerdo en la línea de comandos ronco y ver de inmediato la respuesta. Este método es útil para la creación de prototipos durante el desarrollo inicial y con escenarios hipotéticos.

  • Incrustado: declaraciones Latín de cerdo pueden ser ejecutadas dentro de los programas de Java, Python o javascript.

scripts de cerdo, los comandos shell ronco cerdo, cerdo y programas integrados pueden funcionar tanto en modo local o en el modo de MapReduce.

La cáscara ronco proporciona un shell interactivo para presentar los comandos de cerdo o de cerdo ejecutar secuencias de comandos. Para iniciar la cáscara del ronco en modo interactivo, simplemente presentar el cerdo comando en su shell.

Para especificar si una secuencia de comandos o shell ronco se ejecuta de forma local o en el modo de Hadoop sólo tiene que especificar en la bandera -x al comando de cerdo. El siguiente es un ejemplo de cómo le gustaría especificar ejecutar el script de cerdo en modo local

-x cerdo milesPerCarrier.pig locales 

Aquí te mostramos cómo ejecutar el script de cerdo en el modo de Hadoop, que es el valor predeterminado si no se especifica la bandera:

-x cerdo milesPerCarrier.pig mapreduce

De manera predeterminada, cuando se especifica el comando de cerdo sin ningún parámetro, se inicia la cáscara del ronco en el modo de Hadoop. Si desea iniciar la cáscara del ronco en modo local sólo tiene que añadir la bandera local de -x al comando. Aquí hay un ejemplo

cerdo -x locales
Artículos Relacionados