Proč byste měli míchat, když se již můžete připojit k tablu?



Data Blending in Tableau - metoda použitá, když jsou související data ve více zdrojích dat, která chcete analyzovat společně v jednom zobrazení.

Ve světě, který generuje a spotřebuje 2,5 kvintilionu bajtů dat denně, jsou organizace povinny hledat nové metody pro transformaci a kombinování dat za účelem dosažení optimální efektivity. Jednou z takových metod kombinování dat je Míchání dat v tabulce .

Nyní, protože to slouží tak důležitému účelu v datovém cyklu jakékoli dané organizace, je to ve většině případů velmi důležitý modul . V tomto blogu probereme následující koncepty:





Proč potřebujete Data Blending v Tableau?

Předpokládejme, že jste Tabulka vývojářů kdo má transakční data uložená v Salesforce a data kvót uložená v Accessu. Data, která chcete kombinovat, jsou uložena v různých databázích a granularita dat zachycených v každé tabulce se liší ve dvou zdrojích dat, takže míchání dat je nejlepší způsob, jak tato data kombinovat.

Kombinování dat je užitečné za následujících podmínek:



  1. Chcete kombinovat data z různých databází, která nejsou podporována spojením mezi databázemi.

    Spojení mezi databázemi nepodporují připojení k krychlím (například Oracle Essbase) nebo k některým připojením pouze pro extrakci (například Google Analytics). V takovém případě nastavte jednotlivé zdroje dat pro data, která chcete analyzovat, a pak pomocí kombinování dat zkombinujte zdroje dat na jeden list.

    c vs c ++ vs java
  2. Data jsou na různých úrovních podrobností.

    Někdy jedna sada dat zachycuje data pomocí různých úrovně podrobností tj. větší nebo menší zrnitost než ostatní soubory dat.

    Předpokládejme například, že analyzujete transakční data a data kvót. Transakční data mohou zachytit všechny transakce. Údaje o kvótách však mohou agregovat transakce na úrovni čtvrtletí. Protože transakční hodnoty jsou v každé datové sadě zachyceny na různých úrovních podrobností, měli byste data kombinovat pomocí kombinování dat.



Co je míchání dat v tabulce?

Data Blending je velmi výkonná funkce v systému Windows Deska . Používá se, když jsou ve více zdrojích dat související data, která chcete analyzovat společně v jednom zobrazení. Jedná se o metodu pro kombinování dat, která doplňuje tabulku dat z jednoho zdroje dat o sloupce dat z jiného zdroje dat.

Obvykle se k provádění tohoto druhu kombinování dat používají spojení, ale v některých případech, v závislosti na faktorech, jako je typ dat a jejich členitost, je lepší použít kombinování dat.

co je echo v php

Jak se liší od připojení dat?

Míchání dat simuluje tradiční připojení vlevo. Hlavní rozdíl mezi nimi je když spojení se provádí s ohledem na agregaci.

Vlevo se připojte

Když použijete levé spojení ke kombinování dat, odešle se dotaz do databáze, kde se spojení provede. Použití levého spojení vrátí všechny řádky z levé tabulky a všechny řádky z pravé tabulky, která má odpovídající shodu řádků v levé tabulce. Výsledky spojení jsou poté odeslány zpět do a agregovány Tableau.

Předpokládejme například, že máte následující tabulky. Pokud jsou společné sloupce uživatelské ID , levé spojení vezme všechna data z levé tabulky, stejně jako všechna data z pravé tabulky, protože každý řádek má odpovídající shodu řádků v levé tabulce.

Data Joining - Data Blending in Tableau - EdurekaMíchání dat

Když použijete kombinování dat ke kombinování dat, odešle se dotaz do databáze pro každý zdroj dat, který se použije na listu. Výsledky dotazů, včetně agregovaných dat, jsou odeslány zpět a kombinovány Tableau. Pohled používá všechny řádky z primárního zdroje dat, levé tabulky a agregované řádky ze sekundárního zdroje dat, pravé tabulky, na základě dimenze propojovacích polí.

Můžete změnit propojovací pole nebo přidat další propojovací pole tak, aby zahrnovala různé nebo další řádky dat ze sekundárního zdroje dat ve směsi a změnila agregované hodnoty.

Předpokládejme například, že máte následující tabulky. Pokud jsou propojovací pole uživatelské ID v obou tabulkách míchání vašich dat přebírá všechna data z levé tabulky a doplňuje levou tabulku o data z pravé tabulky. V tomto případě nemusí být všechny hodnoty součástí výsledné tabulky z následujících důvodů:

  • Řádek v levé tabulce nemá odpovídající shodu řádků v pravé tabulce, jak je naznačeno hodnotou null.
  • V řádcích v pravé tabulce je několik odpovídajících hodnot, jak je označeno hvězdičkou (*).

Předpokládejme, že máte stejné tabulky jako výše, ale sekundární zdroj dat obsahuje nové pole s názvem Účely . Opět, pokud je pole pro propojení uživatelské ID , smíchání vašich dat vezme všechna data z levé tabulky a doplní je daty z pravé tabulky. V tomto případě uvidíte v předchozím příkladu stejnou hodnotu null a hvězdičky kromě následujících:

  • Protože Účely pole je míra, vidíte hodnoty řádků proÚčelypole agregované před daty v pravé tabulce je kombinováno s daty v levé tabulce.
  • Stejně jako v předchozím příkladu nemá řádek v levé tabulce odpovídající řádek pro Účely pole, jak je označeno druhou nulovou hodnotou.

Kdy nahradit připojení za Míchání

1. Data je třeba vyčistit.

Pokud se vaše tabulky po spojení neshodují správně, nastavte pro každou tabulku zdroje dat, proveďte veškerá nezbytná přizpůsobení (tj. Přejmenujte sloupce, změňte datové typy sloupců, vytvořte skupiny, použijte výpočty atd.) A poté pomocí kombinování dat data zkombinujte.

2. Spojení způsobují duplicitní data.

Duplicitní data po spojení jsou příznakem dat na různých úrovních podrobností. Pokud si všimnete duplicitních dat, namísto vytvoření spojení použijte místo toho prolínání dat k míchání na společné dimenzi.

3. Máte spoustu dat.

Pro kombinování dat ze stejné databáze se obvykle doporučuje spojení. O připojení se stará databáze, což umožňuje připojení využít některé z nativních schopností databáze. Pokud však pracujete s velkými sadami dat, spojení mohou zatěžovat databázi a výrazně ovlivnit výkon. V tomto případě může pomoci míchání dat. Protože Tableau zpracovává kombinování dat po agregaci dat, existuje méně dat ke kombinování. Když existuje méně dat ke kombinování, obecně se výkon zvyšuje.

Míchání dat v tabulce

Míchání dat můžete použít, pokud máte data v samostatných zdrojích dat, které chcete analyzovat společně na jednom listu. Tableau má dva vestavěné zdroje dat pojmenované Samoobsluha a Ukázkový řetěz na kávu.mdb který bude použit k ilustraci míchání dat.

Krok 1: Připojte se ke svým datům a nastavte zdroje dat

  • Připojte se k sadě dat a nastavte zdroj dat na stránce zdroje dat. An inbuilt datový zdroj Ukázkový řetěz na kávu.mdb ,což je databázový soubor MS Access, bude použit k ilustraci prolínání dat.
  • Jít do Data > Nový zdroj dat, připojte se k druhé sadě dat.Tento příklad používá Ukázka - Superstore zdroj dat. Tslepice nastavit zdroj dat.
  • Kliknutím na kartu listu zahájíte vytváření pohledu.

Krok 2: Určete primární zdroj dat

  • Přetáhněte alespoň jedno pole z primárního zdroje dat do zobrazení a označte jej jako primární zdroj dat. V Data v podokně klikněte na zdroj dat, který chcete označit jako primární zdroj dat. V tomto příkladu Ukázkový řetěz na kávu je vybrána.
  • Následující snímek obrazovky ukazuje různé tabulky a spojení dostupné v souboru.

java, co je instance

Krok 3: Určete sekundární zdroj dat

  • Pole použitá v pohledu ze zdrojů dat, která nejsou primárním zdrojem dat nebo aktivní odkazy, automaticky určí následné zdroje dat jako sekundární zdroj dat. V tomto případě Sample Superstore.

Krok 4: Smíchání dat

  • Nyní můžete data z obou zdrojů integrovat na základě společné dimenze ( Stát , v tomto případě). Všimněte si, že vedle dimenze - Stav se objeví malý obrázek odkazu. To naznačuje společnou dimenzi mezi těmito dvěma zdroji dat.
  • Předpokládejme, že vytvoříte sloupcový graf s Poměr zisku ve sloupové polici a Stát v Row Shelf, graf ukazuje, jak se mění poměr zisku pro každý stát v supermarketech i v kavárnách.

Omezení míchání dat v tabulce

  1. Existují některá omezení míchání dat kolem neaditivních agregátů, například MEDIÁN , a RAWSQLAGG .
  2. Míchání dat ohrožuje rychlost dotazu ve vysoké granularitě.
  3. Když se pokusíte seřadit podle vypočítaného pole, které používá smíšená data, vypočítané pole není uvedeno v rozevíracím seznamu Pole v dialogovém okně Seřadit.
  4. Zdroje dat krychle lze použít pouze jako primární zdroj dat pro míchání dat v Tableau. Nelze je použít jako sekundární zdroje dat.

Doufám, že teď máte všichni spravedlivou představu Míchání dat v tabulce z tohoto blogu. Hledáte další znalosti? Nebojte se, toto video vám pomůže lépe pochopit tento koncept.