Il mio background: 4 settimane nel mondo di Hadoop. Abbandonato un po 'in Hive, Pig e Hadoop usando l'Hadoop VM di Cloudera. Ho letto l'articolo di Google su Map-Reduce e GFS ( link PDF ).
Lo capisco-
Il linguaggio del maiale Il latino del maiale è un passaggio da (si adatta al modo in cui i programmatori pensano) SQL come stile dichiarativo di programmazione e il linguaggio di query di Hive ricorda da vicino SQL.
Il maiale si trova in cima a Hadoop e in linea di principio può anche sedersi in cima a Dryad. Potrei sbagliarmi, ma Hive è strettamente associato a Hadoop.
Entrambi i comandi Pig Latin e Hive vengono compilati per mappare e ridurre i lavori.
La mia domanda: qual è l'obiettivo di avere entrambi quando uno (diciamo maiale) potrebbe servire allo scopo. È solo perché il maiale è evangelizzato da Yahoo! e Hive di Facebook?