Big Data a ETL jsou rodina

V tomto blogu uvidíme vztah mezi Big Data a ETL. Talend je nástroj, který se široce používá pro propojení Big Data a ETL.

Big Data byla v poslední době skutečně dostatečně nadšená, stejně jako kvalifikovaní profesionálové, kteří o tom vědí. Nepoužívat své primární dovednosti a začít od nuly není vždy snadná práce. Využití vašich hranatých řezů a přizpůsobení se vyhazovačům s vámi však udělá zázraky. Bingo, mluvíme o učení Big Data pomocí technologie ETL.





Vývojáři ETL, kteří navrhují pracovní postupy transformace dat, mohou velmi dobře používat nástroje a převádět pracovní postupy na úlohy Hadoop. Hadoop je open source framework, který se značně používá ke zpracování BigData pomocí programu MapReduce (což je další technologie s otevřeným zdrojovým kódem, která pomáhá zpracovávat velké množství dat na Hadoop). Najít kvalifikované zdroje v Big Data může být většinou náročné.

délka pole javascript

Pokud vývojář ETL musí najít adresy IP, které učinily více než milion požadavků na webu banky, musí napsat úlohu MapReduce, která zpracovává data webového protokolu uložená v Hadoopu . S pokrokem v technologii ETL však může vývojář úloh pomocí standardních návrhových nástrojů ETL vytvořit tok ETL, který dokáže číst data z více zdrojů v Hadoop (Files, Hive, HBase), spojovat se, agregovat, filtrovat a transformovat data najít odpověď na dotaz na IP adresy.



Talend je jediný nástroj grafického uživatelského rozhraní, který je dostatečně schopný „přeložit“ úlohu ETL na úlohu MapReduce. Úloha Talend ETL se tedy provede jako úloha MapReduce na Hadoopu a dokončí práci s velkými daty během několika minut. Jedná se o klíčovou inovaci, která pomáhá snižovat překážky vstupu v technologii Big Data a umožňuje vývojářům úloh ETL (začátečníkům i pokročilým) provádět vykládku Data Warehouse ve větší míře.

Život ve městě Big Data je s Talendem mnohem jednodušší

Grafická vrstva abstrakce nad aplikacemi Hadoop - díky tomu je život ve světě Big Data mnohem jednodušší.



Co říká Talend: „V souladu s naší historií inovátora a lídra v integraci dat s otevřeným zdrojem je Talend prvním poskytovatelem, který nabízí čisté řešení s otevřeným zdrojovým kódem, které umožňuje integrace velkých dat . Talend Open Studio pro velká data vrstvením snadno použitelného grafického vývojového prostředí na výkonné aplikace Hadoop umožňuje správa velkých dat přístupné více společnostem a více vývojářům než kdykoli předtím.

Díky grafickému pracovnímu prostoru založenému na zatmění umožňuje Talend Open Studio pro velká data vývojářům a datovým vědcům využívat technologie načítání a zpracování Hadoop jako HDFS, HBase, Hive a Pig, aniž by museli psát Aplikace Hadoop kód. Pouhým výběrem grafických komponent z palety, jejich uspořádáním a konfigurací můžete vytvářet úlohy Hadoop. Například:

  1. Načíst data do HDFS (Hadoop Distributed File System)
  2. Použití Hadoop Pig transformovat data v HDFS
  3. Načíst data do a Úl Hadoop založený datový sklad
  4. Proveďte agregace ELT (extrakce, načtení, transformace) v úlu
  5. Vliv Sqoop integrovat relační databáze a Hadoop

Aplikace Hadoop, bezproblémově integrované během několika minut pomocí Talendu.

Aby aplikace Hadoop byly skutečně přístupné pro vaši organizaci, musí být hladce integrovány do vašich celkových datových toků. Talend Open Studio pro velká data je ideální nástroj pro integraci aplikací Hadoop do vaší širší datové architektury. Talend poskytuje více integrovaných komponent konektorů než jakékoli jiné dostupné řešení integrace dat, s více než 800 konektorů které usnadňují čtení nebo zápis do jakéhokoli významného formátu souboru, databáze nebo zabalené podnikové aplikace. Například v Talend Open Studio pro velká data můžete pomocí konfigurovatelných komponent drag 'n drop vytvořit toky integrace dat, které přesouvají data z oddělovacích souborů protokolu do Hadoop Hive, provádějí operace v Hive a extrahují data z Hive do databáze MySQL (nebo Oracle, Sybase, SQL Server atd.).

Chcete vidět, jak snadné může být práce s nejmodernějšími aplikacemi Hadoop?

Není třeba čekat - Talend Open Studio for Big Data je software s otevřeným zdrojovým kódem, který lze zdarma stáhnout a používat pod licencí Apache.

Promluvte si ve městě

Talend byl aVizionář v magickém kvadrantu pro nástroje pro integraci datod roku 2009. Nedávno se také stali průkopníky v oblasti kvality dat a MDM, stejně jako všech ingrediencí k vaření fantastického pokrmu Big Data.

Tvrdí, že: „Integrace velkých dat zvyšuje výkon a škálovatelnost ve vaší organizaci o 45 procent“.

Pouze Talend 5.5 (a vyšší) umožňuje vývojářům generovat vysoce výkonný kód Hadoop, aniž by museli být odborníkem na MapReduce nebo Pig.

Před několika měsíci jeden z článků Talendu řekl: „Adopce na Hadoop rostou raketově a velké i malé společnosti se snaží najít dostatek znalých vývojářů Hadoop, aby uspokojily tuto rostoucí poptávku.“ Pouze Talend 5.5 umožňuje jakémukoli vývojáři integrace dat používat vizuální vývojové prostředí ke generování nativního, vysokého výkonu a vysoce škálovatelného kódu Hadoop. Tím se odemkne velká skupina vývojových zdrojů, které nyní mohou přispívat k projektům velkých dat. Kromě toho zůstává Talend na špici nového vývoje v Hadoopu, který umožňuje projektům analýzy velkých dat podporovat interakce se zákazníky v reálném čase.

jak používat mysql workbench

Talend for Big Data může pomoci pochopit organizace tím, že shromažďuje datové sady z heterogenních zdrojových systémů - jako jsou třetí strany, API a kanály sociálních sítí - a transformuje tato data do vizuálního obrazu cesty end-to-end zákazníkem.

Ať už jde o bankovní průmysl, farmaceutický průmysl, elektronický obchod, pojišťovnictví - Talend může integrovat data v jakémkoli měřítku pomocí snadné kombinace s Hadoop, který se ukazuje jako nejmodernější technologie, která uspokojí poptávku současnosti i budoucnosti.

Používejte případy z celého světa

Počínaje marketingovou kampaní, zákaznickým servisem v bankovním průmyslu až po detekci podvodů jsou velká data všude.

Fibonacciho řada c ++

S více než 800+ konektory samotnými v jejich vydání s otevřeným zdrojovým kódem se tvrdí, že jsou největšími nejvíce podporovanými platformami, které se připojují k cokoli a mohou načíst vše.

S měnícím se vzorem a zaměřeným na NoSQL, Open Source, Hadoop by volba učení Big Data a ETL stylu pomocí Talendu byla nejlogičtějším rozhodnutím pro každého, kdo se zabývá daty v jakékoli formě a kdykoli.

Stručně řečeno, nástroje ETL zdaleka nejsou pasé. Jsou ústředním prvkem ekosystému Big Data a hrají klíčovou roli při umožňování analýzy dat.

To je důvod, proč Talend svítí slovy „Zero to Big Data bez kódování, za méně než 10 minut“.

Máte na nás dotaz? Uveďte je v sekci komentářů a my se vám ozveme.

Související příspěvky: