ARCHITEKTURA DATOVÉHO SKLADU

vytvořit pole objektů

Co je datový sklad?

Datový sklad je centrální umístění, kde jsou uložena konsolidovaná data z více umístění. Data Warehouse se nenačte pokaždé, když se generují nová data, ale koncový uživatel to může posoudit, kdykoli potřebuje nějaké informace. Podnik stanoví určité časové osy, kdy je třeba načíst Data Warehouse, ať už denně, měsíčně nebo jednou za čtvrtletí.

Různé systémy datových skladů mají různé struktury. Některé mohou mít malý počet zdrojů dat, zatímco jiné mohou být velké.

Existuje několik transakčních systémů, zdroj 1 a další zdroje, jak je uvedeno na obrázku. Zdrojem mohou být soubory SAP nebo ploché soubory, a proto může existovat kombinace zdrojů. ETL (Extract, Transfer, Load) se používá k načtení datového skladu do datových trhů. Rozdíl mezi datovým domem a datovým trhem spočívá v tom, že datový sklad se používá napříč organizacemi, zatímco datové tržiště se používají pro individuální přizpůsobené vytváření sestav.

Například ve společnosti existuje více oddělení, jako je finanční oddělení, které se velmi liší od marketingového oddělení. Všichni čerpají data z různých zdrojů a potřebují přizpůsobené reporty. Finanční oddělení se zabývá hlavně statistikami, marketingové oddělení propagací. Marketingové oddělení nevyžaduje žádné informace o financích.

Pro přizpůsobené vytváření sestav je vyžadována podmnožina datového skladu zvaná datové tržiště. Existují dva přístupy k jeho načtení. Nejprve načtěte datový sklad a poté načtěte tržiště nebo naopak. Ve scénáři vykazování, kterým je vrstva přístupu k datům, uživatel přistupuje k datovému skladu a generuje sestavu. Všechny tyto nástroje pro podávání zpráv mají spotřebiteli velmi usnadnit přední rozhraní, protože lidé na úrovni rozhodování se technickými informacemi nezabývají. Jde především o přehlednou použitelnou zprávu.

Proto všechny tyto nástroje pro vytváření zpráv fungují na front-endu, ale na back-endu, generují dotazy a narážejí na databázi a uživatel dostane zprávu včas. Tyto nástroje pro vytváření sestav mohou naplánovat spuštění úloh a generovat sestavy.

co je apache spark vs hadoop

Máte na nás dotaz? Uveďte je prosím v sekci komentáře a my se vám ozveme.

Související příspěvky:

Architektura datového skladu

Tento blog zdůrazňuje celou architekturu datového skladu

Co je datový sklad?

Architektura datového skladu

Kategorie

Popular Articles

Dotazy na rozhovor s Google Data Science: Vše, co potřebujete vědět, abyste to mohli rozluštit

Jaký je průměrný plat vývojáře SQL?

Vše, co potřebujete vědět o NgStyle v Angular 8

Jak implementovat přechod CSS: Animace jsou hotové správně

Poznejte 10 hlavních výzev implementace RPA

# EdurekaSuper31 Tech stipendia - Seznamte se s #SuperTechies

Vše, co potřebujete vědět o časovačích v JavaScriptu

Instalace Apache Hive na Ubuntu

Datové typy MySQL - přehled datových typů v MySQL

Co jsou komentáře v Javě? - Znát jeho typy

Výukový program AWS S3: Hluboce se ponořte do služby Amazon Simple Storage Service

# EdurekaSuper31 Tech stipendia - Seznamte se s #SuperTechies