Zpracování velkých dat s Apache Spark & ​​Scala



Apache Spark přišel jako skvělý vývoj ve zpracování velkých dat.

jak používat vznášet se v css

IST: 7:00 AM - 08:00 AM, 17. října’14





PDT: 18:30 - 19:30, 16. října ’14

Omezená místa !! Vyplňte formulář vpravo a zarezervujte si svůj automat ještě dnes.



Ahoj všichni, 18. října 2014 provádíme bezplatný webinář o Apache Spark a Scala. Název webináře je „Zpracování velkých dat pomocí Apache Spark a Scala“ . Na tomto webináři budou probrána základní témata týkající se Apache Spark a Scala. Během relace lze vyjasnit jakékoli dotazy nebo pochybnosti.

Témata k pokrytí:

  • Co jsou to velká data?
  • Co je Spark?
  • Proč Spark?
  • Jiskrový ekosystém
  • Poznámka o Scale
  • Proč Scala?
  • Ahoj Spark - ruce

Proč Spark?

Apache Spark je open-source výpočetní rámec pro cluster pro komunitní klastry Hadoop. Díky své nepřekonatelné rychlosti, snadnému použití a sofistikované analýze se kvalifikuje jako jeden z nejlepších motorů pro analýzu a zpracování dat pro rozsáhlá data. Následují výhody a funkce, díky nimž je Apache Spark hitem crossover pro provozní i vyšetřovací analytiku:

  • Programy vyvinuté přes Spark běží stokrát rychleji než programy vyvinuté v Hadoop MapReduce.
  • Spark sestavuje 80 operátorů na vysoké úrovni.
  • Streamování Spark umožňuje zpracování dat v reálném čase.
  • GraphX ​​je knihovna pro grafické výpočty.
  • MLib je knihovna strojového učení pro Spark.
  • Spark, který je primárně napsán ve Scale, může být vložen do libovolného operačního systému založeného na JVM, současně může být také použit způsobem REPL (čtení, hodnocení, zpracování a načítání).
  • Má výkonné možnosti ukládání do mezipaměti a vytrvalosti disku.
  • Spark SQL mu umožňuje profesionálně zpracovávat dotazy SQL
  • Apache Spark lze nasadit prostřednictvím Apache Mesos, Yarn v HDFS, HBase, Cassandra nebo Spark Cluster Manager (Sparkův vlastní správce klastrů).
  • Spark simuluje funkční styl a kolekce API Scaly, což je velká výhoda pro vývojáře Scala a Java.

Potřeba Apache Spark:

Spark poskytuje průmyslu obrovské výhody, pokud jde o rychlost, rozmanitost úkolů, které může provádět, flexibilitu, analýzu kvalitních dat, efektivitu nákladů atd., Což jsou potřeby dne. Poskytuje špičková řešení pro analýzu velkých dat v reálném čase pro IT průmysl a uspokojuje rostoucí poptávku zákazníků. Analýza v reálném čase využívá obchodní schopnosti k hromadění. Jeho kompatibilita s Hadoopem umožňuje společnostem rychle jej přijmout. Existuje velká potřeba odborníků a vývojářů, kteří se naučili od Sparku, protože se jedná o relativně novou technologii, která je stále více přijímána.