Architektura datového skladu



Tento blog zdůrazňuje celou architekturu datového skladu

vytvořit pole objektů

Co je datový sklad?

Datový sklad je centrální umístění, kde jsou uložena konsolidovaná data z více umístění. Data Warehouse se nenačte pokaždé, když se generují nová data, ale koncový uživatel to může posoudit, kdykoli potřebuje nějaké informace. Podnik stanoví určité časové osy, kdy je třeba načíst Data Warehouse, ať už denně, měsíčně nebo jednou za čtvrtletí.





Architektura datového skladu

Různé systémy datových skladů mají různé struktury. Některé mohou mít malý počet zdrojů dat, zatímco jiné mohou být velké.

Existuje několik transakčních systémů, zdroj 1 a další zdroje, jak je uvedeno na obrázku. Zdrojem mohou být soubory SAP nebo ploché soubory, a proto může existovat kombinace zdrojů. ETL (Extract, Transfer, Load) se používá k načtení datového skladu do datových trhů. Rozdíl mezi datovým domem a datovým trhem spočívá v tom, že datový sklad se používá napříč organizacemi, zatímco datové tržiště se používají pro individuální přizpůsobené vytváření sestav.



Například ve společnosti existuje více oddělení, jako je finanční oddělení, které se velmi liší od marketingového oddělení. Všichni čerpají data z různých zdrojů a potřebují přizpůsobené reporty. Finanční oddělení se zabývá hlavně statistikami, marketingové oddělení propagací. Marketingové oddělení nevyžaduje žádné informace o financích.

Pro přizpůsobené vytváření sestav je vyžadována podmnožina datového skladu zvaná datové tržiště. Existují dva přístupy k jeho načtení. Nejprve načtěte datový sklad a poté načtěte tržiště nebo naopak. Ve scénáři vykazování, kterým je vrstva přístupu k datům, uživatel přistupuje k datovému skladu a generuje sestavu. Všechny tyto nástroje pro podávání zpráv mají spotřebiteli velmi usnadnit přední rozhraní, protože lidé na úrovni rozhodování se technickými informacemi nezabývají. Jde především o přehlednou použitelnou zprávu.

Proto všechny tyto nástroje pro vytváření zpráv fungují na front-endu, ale na back-endu, generují dotazy a narážejí na databázi a uživatel dostane zprávu včas. Tyto nástroje pro vytváření sestav mohou naplánovat spuštění úloh a generovat sestavy.



co je apache spark vs hadoop

Máte na nás dotaz? Uveďte je prosím v sekci komentáře a my se vám ozveme.

Související příspěvky: