Jak spustit skripty podregistrů?

Toto je návod, jak spouštět skripty Hive. Spuštění tohoto skriptu sníží čas a úsilí, které jsme vynaložili na ruční psaní a provádění každého příkazu.

Jako balíček datových skladů postavený na vrcholu Hadoopu se Apache Hive stále více využívá pro analýzu dat, dolování dat a prediktivní modelování. Organizace hledají profesionály, kteří se pevně drží . V tomto příspěvku se podívejme na to, jak spustit skripty Hive. Obecně používáme skripty k provádění sady příkazů najednou. Skripty podregistrů se používají téměř stejným způsobem. Zkrátí to čas a úsilí, které jsme vynaložili na ruční psaní a provádění každého příkazu.

Skripty Hive jsou podporovány ve verzích Hive 0.10.0 a vyšších. Protože verze Hive 0.90 je nainstalována v CDH3, nemůžeme spouštět skripty Hive v CDH3. Níže uvedené kroky můžete vyzkoušet na CDH4, protože je v nich nainstalována verze Hive 0.10.0. Víte, jak vytvořit skript Hive? Pokud ne, klikněte získat další vysvětlení.





Master-Hive-Now

Nyní se podívejme, jak psát skripty v Hive a spouštět je v CDH4:



Krok 1: Psaní skriptu Hive.

Chcete-li napsat skript Hive, měl by být soubor uložen s příponou .sql. Otevřete terminál ve své distribuci Cloudera CDH4 a zadejte následující příkaz k vytvoření skriptu Hive.
Příkaz: sudo gedit sample.sql

Po provedení výše uvedeného příkazu se otevře soubor se seznamem všech příkazů Hive, které je třeba provést.



java najít největší číslo v poli

V tomto skriptu bude vytvořena, popsána tabulka a načtena a načtena data z tabulky.

1. Vytvoření tabulky v Hive:

Příkaz: vytvořit tabulkový produkt (productid: int, productname: string, price: float, category: string) řádky formátovat pole oddělená poli ukončená znakem „,“

Zde je produkt název tabulky a {productid, productname, price, category} jsou sloupce této tabulky.

Pole ukončená znakem „,“ označují, že sloupce ve vstupním souboru jsou odděleny symbolem „,“.

Ve výchozím nastavení jsou záznamy ve vstupním souboru odděleny novým řádkem.

2. Popis tabulky:

Příkaz: popsat produkt

3. Načtení dat do tabulky.

Chcete-li nejprve načíst data do tabulky, musíme vytvořit vstupní soubor, který obsahuje záznamy, které je třeba vložit do tabulky.

Vytvořme vstupní soubor.

Příkaz: sudo gedit input.txt

Upravte obsah souboru, jak je znázorněno na obrázku.

c ++ jak třídit pole

4. Načítání dat:

K načtení dat se používá příkaz select.

Příkaz: Vyberte * z produktu

Výše uvedený příkaz se používá k načtení hodnoty všech sloupců v tabulce. Skript by měl vypadat tak, jak je zobrazen na následujícím obrázku.

Nyní jsme hotovi s psaním skriptu Hive. Soubor sample.sql lze nyní uložit.

Krok 2: Spuštění skriptu Hive

Následuje příkaz ke spuštění skriptu Hive:

Příkaz: úl –f /home/cloudera/sample.sql

Při provádění skriptu se ujistěte, že je k dispozici celá cesta k umístění souboru skriptu.

Vidíme, že všechny příkazy jsou úspěšně provedeny.

Takto se spouštějí a spouštějí skripty Hive v CDH4.

co je míchání dat v tablo

Hive je klíčovou součástí Hadoop a vaše odborné znalosti v Hive vám mohou přinést nejlépe placené úlohy Hadoop! Edureka má speciálně kurátorovaný kurz Hadoop, který vám pomůže zvládnout koncepty jako MapReduce, Yarn, Pig, Hive, HBase, Oozie, Flume a Sqoop. Začněte kliknutím na tlačítko níže.

Máte na nás dotaz? Uveďte je prosím v sekci komentáře a my se vám ozveme.

Související příspěvky:

Příkazy úlu

Úlové datové modely