1. Stáhněte si Oracle Expresss Edition z níže uvedeného odkazu a rozbalte jej.
https://docs.google.com/a/edureka.in/file/d/0B2-rlCGKD40NNW5BcHZMTkdtcmc/edit
2. Po rozbalení najdete spustitelný soubor Oracle XE Edition jako na následujícím obrázku.
3. Poklepáním na OracleXEUniv nainstalujte databázi Oracle do svého systému a klepněte na Spustit.
4. Klikněte na Další
5. Přijměte licenční smlouvu a klikněte na další.
6. Ve výchozím nastavení Oracle vezme systém jako název databáze. Zadejte heslo
pro tuto databázi.
Zadejte heslo -> systém
Potvrďte heslo -> systém
Klikněte na Další:
7. Klikněte na Instalovat
8. Klikněte na Dokončit
9. Upravme soubor sqlnet.ora ve složce
C: oraclexepporacleproduct.2.0serverNETWORKADMIN
Po otevření najdete níže uvedený obsah.
Upravte jej jako v níže uvedeném snímku obrazovky
10. Začněme příkazový řádek SQL Oracle.
Přejít na nabídku Start -> Všechny programy -> Oracle Database 10g Express Edition ->
Spusťte příkazový řádek SQL a dvakrát na něj klikněte.
11. Získáte Cli pro Oracle Database.
12. Pojďme se připojit k databázi Oracle.
Uživatelské jméno: systém
Heslo: systém
Zobrazí se zpráva úspěšně připojena.
13. Vytvořme jednoduchou tabulku.
Příkaz:
vytvořit tabulku emp (id number)
14. Vložme do něj některé hodnoty pomocí příkazu Vložit.
Příkaz:
vložit do emp hodnot (2)
15. Nechte nás zkontrolovat, zda jsou data vložena do tabulky pomocí příkazu Select.
Příkaz:
vyberte * z emp
16. Udělejme data.
Příkaz:
spáchat
17. Pro import dat z Oracle Database do Sqoop musíme přidat
Oracle Connector (ojdbc6_g.jar).
Sklenici si můžete stáhnout z níže uvedeného odkazu.
https://docs.google.com/a/edureka.in/file/d/0B2-rlCGKD40Nekw3ZXBRWUU5Y1E/edit
18. Otevřete Cloudera cdh3 a pomocí FileZilla přesuňte konektor Oracle na Cloudera cdh3 (na plochu).
Pomocí níže uvedeného odkazu pochopíte, jak přesunout soubor z Windows do cloudera cdh3 vm.
https://www.edureka.co/blog/transfer-files-windows-cloudera-demo-vm/
19. Jakmile je konektor Oracle na Cloudera Cdh3 Desktop, přesuňte jej do složky lib v
sqoop provedením následujícího příkazu:
Příkaz:
sudo cp /home/cloudera/Desktop/ojdbc6_g.jar / usr / lib / sqoop / lib /
co je skener v Javě
20. Změňte adresář na Sqoop provedením následujícího příkazu:
Příkaz:
cd / usr / lib / sqoop /
21. Otevřete příkazový řádek (CMD) ve Windows a zkontrolujte Adresa IPv4
provedením
pod příkazem:
Příkaz:
ipconfig
22. Importujte data tabulky emp přítomná v databázi Oracle do hdfs provedením níže uvedeného
příkaz:
Povinné položky pro příkaz:
IPv4 Address - Vaše IPv4 adresa. V mém případě je to 192.168.46.1
Název databáze - systém
Název tabulky - emp
Uživatelské jméno - systém
Heslo - systém
Výstupní adresář - může být libovolný. Použil jsem sqoopoutput1
Příkaz:
sudo bin / sqoop import –connect jdbc: oracle: thin: system /
system@192.168.46.1: 1521: vozidlo
–Username system -P –tabulka system.emp –sloupce „ID“ –target-dir /
sqoopoutput1 -m 1
23. Jakmile bude příkaz úspěšně proveden, obdržíte zprávu
že načtené záznamy jako na obrázku níže.
24. Otevřete prohlížeč a přejděte na níže uvedenou adresu URL:
URL: http: // localhost: 50070 / dfshealth.jsp
Klikněte na Procházet souborový systém
25. Klikněte na adresář sqoopoutput1
26. Klikněte na soubor part-m-00000:
27. Níže jsou uvedena data, která byla importována z databáze Oracle:
Gratulujeme! Úspěšně jste importovali data z databáze Oracle
na HDFS pomocí Sqoop ..!