Úvod do rodiny sloupců s Cassandrou



Tento blog zdůrazňuje důležitost rodiny sloupců s Cassandrou

Rodina sloupců

Rodina Column je podobná tabulce v RDBMS nebo Relational Database Management System a je logickým dělením, které spojuje podobná data. V zásadě máte v podobných datech tendenci ukládat nějaký druh dat, která mají podobný předmět.

Například data objednávky jsou uložena v jedné rodině sloupců, takže můžete mít ID objednávky jako klíč řádku a také různé sloupce, jako by byl druh produktu přinesen jako součást této objednávky, aby byly uloženy v konkrétní rodině objednávky . Abychom uvedli určité příklady, rodina sloupců uživatelů se skládá z ID uživatele jako klíče. Jeden si tedy může zvolit ID a sloupce mohou být „name = Kunal“. A hodnoty sloupce jsou Kunal a Bangalore. Existuje druhá rodina sloupců s názvem Rodina sloupců kriketu, která umožňuje ukládání statistik hráčů kriketu do jedné rodiny sloupců. Například můžete mít Sachin Tendulkar v jednom sloupci a počet století v jiném. Proto může existovat libovolný počet sloupců.





Druhy sloupců

Rodina sloupců není nic jiného než tabulka, která je obdobou tabulky ve světě RDBMS. Existují určité typy, jmenovitě

Statický sloupec Rodina - Rodina statických sloupců je místo, kde jsou definovány názvy a datové typy. Když je tedy vytvořena rodina sloupců, je k dispozici možnost pojmenovat název sloupce a datové typy. Říká se tomu statické, protože sloupce zůstávají statické a bude znám počet dostupných sloupců.



Dynamická rodina sloupců - Dynamická rodina sloupců na druhé straně nedefinuje názvy sloupců dopředu a je k dispozici schopnost Cassandry používat libovolné názvy aplikací a sloupců k ukládání dat. Takže dynamika svým způsobem pomáhá, protože v nestrukturovaných datech většinou dynamická rodina sloupců pomáhá při péči o nová pole, která mohla být přidána později.

Pokud máte statickou rodinu sloupců a chcete do svého kódu při načítání dat přidat dynamickou rodinu sloupců, lze ji kdykoli přidat do statické rodiny sloupců. Cassandra dává svobodu při výběru názvů sloupců.

Fibonacciho sekvence Java pro smyčku

Rozdíl s RDBMS

Rodina sloupců Cassandra je bez schémat a je velmi škálovatelná. Rodina sloupců Cassandra má dva atributy - název a komparátor. Takže pokud máte rodinu sloupců Cassandra, její pojmenování se stává povinným a komparátor je v podstatě datový typ pro názvy sloupců. Pokud nezadáte komparátor, bude se předpokládat, že jde o nějaký výchozí komparátor.



Cassandra má také sloupec supersloupcových rodin. Bude interně používat super sloupec. Jedná se o logické seskupení a další úroveň seskupování sloupců. Takže v rodině sloupců uživatelů můžete mít dva super sloupce, kde můžeme mít osobní informace uživatelů a informace o produktech.

jak vytvořit jframe v java

Sloupce

Sloupec je nejmenší přírůstek dat v Cassandře. Má 3 komponenty:

  • název
  • Hodnota
  • Časové razítko - Používá se při řešení konfliktů a časové razítko nelze upravit. Jedná se o interní mechanismus, který umožňuje zjistit, kdy byla tato data nebo sloupec aktualizována.
  • Končící sloupce - Sloupci lze dát datum vypršení platnosti, abychom věděli, že platnost sloupce vyprší.
  • Počítadlo sloupců - Počítadlo sloupců není nic jiného než údržba sloupců, takže můžete tyto sloupce počítadla zvyšovat a snižovat.

Super sloupy

Super Columns je seskupení všech sloupců dohromady v závislosti na obchodní potřebě a logickém seskupení. Přidává další úroveň vnoření do běžné struktury rodiny sloupců. Zahrnují super rodinnou strukturu sloupců.

Primárním případem pro super sloupce je denormalizace více řádků z jiných rodin sloupců do jednoho řádku, což umožňuje načítání dat materializovaného pohledu.

Případy užití

Omezení super sloupců

Jedním omezením je, že všechny dílčí sloupce rodiny super sloupců musí být de-serializovány, aby bylo možné přečíst jednu rodinu dílčích sloupců. Dalším omezením je, že nemůžeme vytvořit sekundární indexy na dílčích sloupcích super sloupce.

Sloupcové datové typy

Datové typy sloupců

Na obrázku výše jsou různé datové typy. Datový typ pro hodnotu sloupce se nazývá validátor. A komparátor je datový typ pro sloupec. Jméno a adresa se stanou názvem sloupce. Takže v případě názvů sloupců můžete mít datum. Data časové řady můžete mít také tak, že jako název sloupce budete mít datum.

Řádky

Může existovat široké řádky a několik řádků. K dispozici mohou být miliony sloupců a řádků.

Úzké řádky mají malý počet sloupců, které mají možnost mít pouze omezené řádky.

Složený klíč

Skládá se z jednoho nebo více polí primárního klíče. Předpokládejme, že název města je nastaven jako klíč řádku, možná existuje město pojmenované ve dvou různých státech, takže budete muset zmínit, které město a který stát. To jednoduše znamená, že je třeba uvést klíč. Místo jednoduchého klíče sloupce jednoho typu můžete agregovat několik hodnot, které se také nazývají komponenty několika typů, a vytvořit tak jeden jedinečný klíč sloupce.

Máte na nás dotaz? Uveďte je v sekci komentáře a my se vám ozveme.

Související příspěvky:

Úvod do zlatonek v Cassandře

ansible vs loutka vs kuchař