Případy použití Apache Storm



Apache Storm je populární díky svým funkcím zpracování v reálném čase a byl implementován právě z tohoto důvodu. Zde je několik případů použití Apache Storm.

Apache Storm je populární díky svým funkcím zpracování v reálném čase a mnoho organizací jej implementovalo jako součást svého systému právě z tohoto důvodu. Pojďme se podívat na to, jak organizace integrují Apache Storm.





Případy použití Apache Storm:

Cvrlikání

Storm se používá k napájení různých systémů Twitter, jako je analýza v reálném čase, personalizace, vyhledávání, optimalizace výnosů a mnoho dalších. Apache Storm se přizpůsobuje zbytku infrastruktury Twitteru, která zahrnuje databázové systémy jako Cassandra, Memcached atd., Infrastrukturu zasílání zpráv, Mesos a monitorovací a výstražné systémy. Plánovač izolace společnosti Storm umožňuje využívat stejný klastr také pro produkční aplikace a aplikace ve vývoji. Poskytuje efektivní způsob plánování kapacity.

generovat náhodný řetězec v javě

Yahoo!
Yahoo! pracuje na platformě nové generace, která umožňuje sloučení Big Data a zpracování s nízkou latencí. Ačkoli Hadoop je primární technologie, která se zde používá pro dávkové zpracování, Apache Storm umožňuje streamované zpracování událostí uživatelů, kanálů obsahu a protokolů aplikací.



Infochimps
Infochimps používá Apache Storm jako zdroj pro jednu ze tří svých cloudových datových služeb - Data Delivery Services (DDS), které využívají Storm k zajištění odolného a lineárně škálovatelného sběru podnikových dat, přenosu a komplexní cloudové služby zpracování in-stream . Podobně jako Hadoop, který poskytuje dávkové ETL a dávkové analytické zpracování ve velkém měřítku, poskytuje DDS také ETL v reálném čase a zpracování ve velkém měřítku v reálném čase.

Flipboard
Flipboard je jediné místo, kde můžete zkoumat, shromažďovat a sdílet zprávy, které vás zajímají. Flipboard využívá bouři pro širokou škálu služeb, jako je vyhledávání obsahu, analýza v reálném čase, vlastní zdroje časopisů atd. Apache Storm je integrován s infrastrukturou, která zahrnuje systémy jako ElasticSearch, Hadoop, HBase a HDFS, k vytvoření vysoce škálovatelné datové platformy.

Ooyala
Ooyala je soukromá společnost s podporou podnikání, která poskytuje produkty a služby online video technologie pro některé z největších světových sítí, značek a mediálních společností. Ooyala má analytický engine, který každý den zpracovává více než dvě miliardy analytických událostí, generovaných od téměř 200 milionů diváků po celém světě, kteří sledují video na přehrávači poháněném Ooyala. Ooyala využívá Apache Storm k poskytování svým zákazníkům analytiku streamování rela-time týkající se chování spotřebitelů při sledování a trendů digitálního obsahu. Storm umožňuje rychlou těžbu jejich online video datových sad, aby poskytly aktuální obchodní inteligenci, jako je prohlížení vzorů v reálném čase, návrhy přizpůsobeného obsahu, průvodci programováním a cenné poznatky o způsobech, jak zvýšit příjmy.



Taobao
Taobao s pomocí Apache Storm vytváří statistiky protokolů a extrahuje ze statistik užitečné informace v reálném čase. Protokoly se načítají z perzistentních front zpráv do výtoků, zpracovávají se a poté se předávají topologiím, aby se vypočítaly požadované výsledky. Počet vstupních protokolů Taobao se každý den pohybuje mezi 2 miliony až 1,5 miliardami.

Klout
Klout je aplikace, která pomocí analytiky sociálních médií hodnotí své uživatele na základě sociálního online vlivu prostřednictvím „Klout Score“, což je číselná hodnota mezi 1 a 100. Klout využívá vestavěnou abstrakci Trident od Apache Storm k vytváření složitých topologií, které streamují data ze síťových kolektorů přes Kafku, poté zpracovány a zapsány na HDFS.

Jdeme
Wega je světový komplexní metasearch pro cestování, fungující po celém světě a využívaný bezpočtem cestovatelů k získání více možností platit méně a cestovat více. Wego porovnává a zobrazuje letové řády v reálném čase, dostupnost hotelu, cenu a zobrazuje další cestovní weby po celém světě. Zde Apache Storm přenáší data metasearch v reálném čase z přidružených společností ke koncovým uživatelům. Koncepty topologie ve Stormu řeší problémy souběžnosti a zároveň jim pomáhají neúnavně integrovat, pitvat a čistit data. Nástroje poskytované ve Stormu navíc umožňují přírůstkovou aktualizaci, která vylepšuje jejich data.

Raketové palivo
Rocket Fuel přináší přední platformu pro nákup médií v měřítku Big Data, která využívá sílu umělé inteligence (AI) k rozšíření marketingové návratnosti investic v digitálních médiích. Na platformě Storm staví platformu v reálném čase, která napodobuje časově kritické pracovní toky, které již existují v potrubí ETL založeném na Hadoop. Tato platforma sleduje v reálném čase zobrazení, kliknutí, konverze, žádosti o nabídky atd.

Navsite
Navsite používá Apache Storm jako součást svého systému monitorování a auditu protokolu událostí serveru. Zprávy protokolu z tisíců serverů jsou odesílány do clusteru RabbitMQ a Storm se používá k porovnání každé zprávy se sadou regulárních výrazů. Pokud existuje shoda, zpráva se odešle do šroubu, který ukládá data do MongoDB. V tuto chvíli se zpracovává 5–10 000 zpráv za sekundu, avšak existující klastry RabbitMQ + Storm byly testovány až do rychlosti 50 000 za sekundu.

Existuje mnoho dalších organizací implementujících Apache Storm a očekává se, že se k této hře připojí ještě více, protože Apache Storm je i nadále lídrem v analýze v reálném čase.

Podívejte se na naše .

nastavení java classpath v linuxu