Oracle na HDFS pomocí Sqoop

Oracle to HDFS using Sqoop - Podívejte se na kroky pro Oracle to HDFS pomocí Sqoop.

1. Stáhněte si Oracle Expresss Edition z níže uvedeného odkazu a rozbalte jej.





https://docs.google.com/a/edureka.in/file/d/0B2-rlCGKD40NNW5BcHZMTkdtcmc/edit

61



2. Po rozbalení najdete spustitelný soubor Oracle XE Edition jako na následujícím obrázku.

3. Poklepáním na OracleXEUniv nainstalujte databázi Oracle do svého systému a klepněte na Spustit.



4. Klikněte na Další

5. Přijměte licenční smlouvu a klikněte na další.

6. Ve výchozím nastavení Oracle vezme systém jako název databáze. Zadejte heslo

pro tuto databázi.

Zadejte heslo -> systém

Potvrďte heslo -> systém

Klikněte na Další:

7. Klikněte na Instalovat

8. Klikněte na Dokončit

9. Upravme soubor sqlnet.ora ve složce

C: oraclexepporacleproduct.2.0serverNETWORKADMIN

Po otevření najdete níže uvedený obsah.

Upravte jej jako v níže uvedeném snímku obrazovky

10. Začněme příkazový řádek SQL Oracle.

Přejít na nabídku Start -> Všechny programy -> Oracle Database 10g Express Edition ->

Spusťte příkazový řádek SQL a dvakrát na něj klikněte.

11. Získáte Cli pro Oracle Database.

12. Pojďme se připojit k databázi Oracle.

Uživatelské jméno: systém

Heslo: systém

Zobrazí se zpráva úspěšně připojena.

13. Vytvořme jednoduchou tabulku.

Příkaz:

vytvořit tabulku emp (id number)

14. Vložme do něj některé hodnoty pomocí příkazu Vložit.

Příkaz:

vložit do emp hodnot (2)

15. Nechte nás zkontrolovat, zda jsou data vložena do tabulky pomocí příkazu Select.

Příkaz:

vyberte * z emp

16. Udělejme data.

Příkaz:

spáchat

17. Pro import dat z Oracle Database do Sqoop musíme přidat

Oracle Connector (ojdbc6_g.jar).

Sklenici si můžete stáhnout z níže uvedeného odkazu.

https://docs.google.com/a/edureka.in/file/d/0B2-rlCGKD40Nekw3ZXBRWUU5Y1E/edit

18. Otevřete Cloudera cdh3 a pomocí FileZilla přesuňte konektor Oracle na Cloudera cdh3 (na plochu).

Pomocí níže uvedeného odkazu pochopíte, jak přesunout soubor z Windows do cloudera cdh3 vm.

https://www.edureka.co/blog/transfer-files-windows-cloudera-demo-vm/

19. Jakmile je konektor Oracle na Cloudera Cdh3 Desktop, přesuňte jej do složky lib v

sqoop provedením následujícího příkazu:

Příkaz:

sudo cp /home/cloudera/Desktop/ojdbc6_g.jar / usr / lib / sqoop / lib /

co je skener v Javě

20. Změňte adresář na Sqoop provedením následujícího příkazu:

Příkaz:

cd / usr / lib / sqoop /

21. Otevřete příkazový řádek (CMD) ve Windows a zkontrolujte Adresa IPv4

provedením

pod příkazem:

Příkaz:

ipconfig

22. Importujte data tabulky emp přítomná v databázi Oracle do hdfs provedením níže uvedeného

příkaz:

Povinné položky pro příkaz:

IPv4 Address - Vaše IPv4 adresa. V mém případě je to 192.168.46.1

Název databáze - systém

Název tabulky - emp

Uživatelské jméno - systém

Heslo - systém

Výstupní adresář - může být libovolný. Použil jsem sqoopoutput1

Příkaz:

sudo bin / sqoop import –connect jdbc: oracle: thin: system /

system@192.168.46.1: 1521: vozidlo

–Username system -P –tabulka system.emp –sloupce „ID“ –target-dir /

sqoopoutput1 -m 1

23. Jakmile bude příkaz úspěšně proveden, obdržíte zprávu

že načtené záznamy jako na obrázku níže.

24. Otevřete prohlížeč a přejděte na níže uvedenou adresu URL:

URL: http: // localhost: 50070 / dfshealth.jsp

Klikněte na Procházet souborový systém

25. Klikněte na adresář sqoopoutput1

26. Klikněte na soubor part-m-00000:

27. Níže jsou uvedena data, která byla importována z databáze Oracle:

Gratulujeme! Úspěšně jste importovali data z databáze Oracle

na HDFS pomocí Sqoop ..!