OLTP vs OLAP



Následující blog stručně hovoří o OLTP vs OLAP a různých případech použití.

OLTP vs OLAP

Říká se, že OLTP je spíše online transakční systém nebo systém pro ukládání dat, kde uživatel provádí velké množství online transakcí pomocí datového úložiště. Rovněž se říká, že v reálném čase probíhá více ad-hoc čtení / zápisů.





OLAP je spíše offline úložiště dat. Je přístupnýněkolikrátoffline. Například soubory hromadného protokolu jsou čteny a poté zapsány zpět do datových souborů. Mezi běžné oblasti, kde se používá OLAP, patří Log Logs, Data mining Jobs atd.

Cassandra se říká, že je více OLTP, protože je v reálném čase, zatímco Hadoop je více OLAP, protože se používá pro analytiku a hromadné zápisy.



Proč integrovat OLAP a OLTP?

Pokud hledáte nejlevnější cenu za rezervaci hotelů v příštích 365 dnech, máte zde obrovskou sadu dat pro Cassandru a chcete mít doporučení pro databázi v reálném čase, promo akce se spustí na základě ceny.

V takovém scénáři musíme iterovat všechny záznamy a udržovat nad nimi analytiku, což je obrovská offline práce, kterou je třeba často nastartovat. Zde Hadoop vstupuje do hry pro hromadné datové křupání.

Další výhodou je, že můžeme spustit jeden klastr a přerušit provoz jiného klastru Hadoop.



Třetí výhodou je, že lze také snížit mnoho provozních nákladů.

Vzhledem k scénáři, ve kterém, pokud se uživatel dobře orientuje v různých ekosystémech Hadoop, jako je Hive, Pig Latin a potřebuje do něj integrovat data, je třeba v Cassandře připojit nějaký zdroj dat a zkusit spustit Map Snižte také počet pracovních míst.

Mezi OLTP a OLAP je patrný vzor. V OLTP je menší počet zápisů, např. Informace o hotelu. Za předpokladu, že ke změnám ceny dojde každých 5 000krát za sekundu, může být čtení zde více. V takovém scénáři může existovat 1 zápis za sekundu, ale čtení by mohlo být vyloučeno na stovky a tisíce. Poměr je tedy kolem 1: 1000.

Je zajímavým pozorováním, že Cassandra se snadno vejde do tohoto modelu, který zahrnuje modely, kde je čtení i zápis stejné. Také, pokud jde o OLTP, i když se člověk dostane do laditelného a silného modelu konzistence, může vidět milisekundovou propast mezi případnými konzistentními modely a nejsilnějšími konzistentními modely. Cassandra se tedy vejde do OLTP.

Když přijdete na OLAP, můžete vidět různé vzory OLAP, což znamená, že probíhá několik zápisů současně. V OLAP ukládáme data v jednom záběru, tj. Všechny soubory protokolu se ukládají do datového úložiště a poté začneme zpracovávat. Datový vzor nebo přístupový vzor je přesně opačný k druhu aplikace OLTP. Zde bude užitečné Hadoop nebo MapReduce.

Máte na nás dotaz? Uveďte je v sekci komentáře a my se vám ozveme.

Související příspěvky:

Top 5 důvodů, proč se učit Cassandru

co je serializováno v Javě