Dovednosti klíčových vědců

Tento blog popisuje základní dovednosti Data Scientist spolu s kontrolním seznamem dovedností potřebných k tomu, aby se stal úžasným a efektivním datovým vědcem. Přečtěte si >>>

Dva analytici z LinkedIn vytvořili v roce 2008 pojem „datový vědec“. Jen se snažili popsat, co dělají, tj. Odvozovat obchodní hodnotu z obrovských dat generovaných jejich webem. V tomto procesu nakonec pojmenovali název pracovní pozice, který by v nadcházejících letech zaznamenal neuvěřitelnou poptávku a byl dokonce označen jako „Nejsexi práce z 21Svatýstoletí.'

Organizace, které považují „data“ za cenné aktivum, nyní hledají tyto datové odborníky nebo „vědce“, aby je vedli do budoucnosti.





Co tedy znamená být skvělým datovým vědcem? ……… Různé sady dovedností!

Krátký pohled na základní dovednosti datového vědce.



Proces datové vědy zahrnuje 3 fáze.

  • Zachycení dat
  • Analýza dat
  • Prezentace

Podívejme se blíže na roli datového vědce v každé z těchto fází.

Zachycení dat



  • Programovací a databázové dovednosti

Prvním krokem těžby dat je zachytit správná data. Chcete-li být datovým vědcem, je velmi důležité znát nástroje a technologie, zejména ty open source jako Hadoop, Java, Python, C ++ a databázové technologie jako SQL, NoSQL, HBase a tak dále.

  • Obchodní doména a odborné znalosti

Údaje se liší podle podnikání. Proto pochopení obchodních dat vyžaduje odborné znalosti, které přicházejí pouze při práci v konkrétní datové doméně.

Například: Data shromážděná z lékařského oboru se budou zcela lišit od údajů maloobchodního obchodu s oděvy.

  • Datové modelování, sklad a nestrukturované datové dovednosti

Organizace shromažďují obrovské množství dat prostřednictvím různých zdrojů. Data zachycená tímto způsobem jsou nestrukturovaná a je třeba je před analýzou uspořádat. Datový vědec proto musí být zdatný v modelování nestrukturovaných dat.

Analýza dat

  • Statistické dovednosti nástroje

Základní dovedností datového vědce je vědět, jak používat statistické nástroje jako R, Excel, SAS a tak dále. Tyto nástroje jsou potřebné k rozemletí zachycených dat a jejich analýze.

  • Matematické dovednosti

Samotné znalosti výpočetní techniky nestačí k tomu, abychom byli datovým vědcem. Profil datového vědce vyžaduje někoho, kdo dokáže porozumět rozsáhlým algoritmům strojového učení a programování, a přitom být zkušeným statistikem. To vyžaduje odborné znalosti v jiných vědeckých a matematických oborech kromě počítačových jazyků.

Prezentace

  • Dovednosti vizualizačního nástroje

Možná budete schopni shromáždit data vytěžit a modelovat, ale dokážete si to vizualizovat?

Chcete-li být úspěšným vědeckým pracovníkem v oblasti dat, měli byste být schopni pracovat s některými nástroji pro vizualizaci dat a vizuálně tak prezentovat analýzy dat. Mezi ně patří R, Flare, HighCharts, AmCharts, D3.js, Processing a Google Visualization API atd.

Ale to není konec! Pokud se opravdu chcete stát datovým vědcem, měli byste mít také následující dovednosti:

  • Komunikační dovednosti: Statistiky a Excel jsou složité řešení. Data Scientists by měli být schopni prezentovat data způsobem, který sděluje výsledky obchodním uživatelům.
  • Obchodní dovednosti : Datoví vědci budou muset hrát více rolí. Potřebovali by komunikovat s různými lidmi v organizaci. Proto bude velmi užitečné mít silné obchodní dovednosti, které zahrnují komunikaci, plánování, organizaci a správu. To zahrnuje pochopení obchodních a aplikačních požadavků a odpovídající interpretaci informací. Také by měl mít celkové znalosti o klíčových výzvách v tomto odvětví a měl by si být vědom finančních poměrů pro lepší rozhodování. Sečteno a podtrženo, vědec v oblasti dat si také myslí „podnikání“.
  • Zkušenosti s řešením problému: To se zdá být zřejmé, protože věda o datech je o řešení problémů. Efektivní vědec v oblasti dat musí věnovat čas a důkladně se zabývat problémem a přijít s proveditelným řešením, které bude vyhovovat uživateli.
  • Predikční dovednosti: Vědec v oblasti dat by měl být také účinným prediktorem. Měl by mít široké znalosti o algoritmech, aby vybral ten správný, aby správně zapadl do datového modelu. To vyžaduje určité množství kreativity, které je třeba použít a údaje reprezentovat moudře.
  • Hackování: Vím, že to zní strašidelně, ale různé hackerské dovednosti, jako je manipulace s textovými soubory na příkazovém řádku, porozumění vektorizovaným operacím a algoritmické myšlení, z vás udělají lepšího vědce v oblasti dat.

Při pohledu na výše uvedené sady dovedností je jasné, že být vědcem v oblasti dat není jen o tom, vědět vše o datech. Jedná se o pracovní profil se sloučením datových dovedností, matematických dovedností, obchodních dovedností a komunikačních dovedností. Se všemi těmito dovednostmi dohromady lze dát Data Scientist oprávněně nazvat rockovou hvězdou v oblasti IT.

Zkontrolujte seznam a staňte se úžasným a efektivním datovým vědcem:

co je připojeno v Javě

Pokryli jsme dovednosti, které jsou zapotřebí, abychom se stali datovým vědcem. Je obrovským rozdílem stát se datovým vědcem a stát se úžasným a efektivním datovým vědcem. Následující dovednosti spolu s výše uvedenými dovednostmi vás odlišují od toho, že jste normální nebo dokonce průměrný datový vědec.

  • Matematické dovednosti - Výpočty, maticové operace, numerická optimalizace, stochastické metody atd.
  • Statistické dovednosti - Regresní modely, koryta, klasifikace, diagnostika, aplikovaná statistika atd.
  • Sdělení - Vizualizace, prezentace a psaní.
  • Databáze - Kromě CouchDB znalosti v netradičních databázích jako MongoDB a Vertica.
  • Programovací jazyky - Pig, Hive, Java, Python atd.
  • Zpracování přirozeného jazyka a Dolování dat.

Edureka má speciálně upravený který vám pomůže získat odborné znalosti v oblasti algoritmů strojového učení, jako je shlukování K-Means, rozhodovací stromy, náhodný les, naivní Bayes. Naučíte se také pojmy Statistika, Časové řady, Těžba textu a úvod do Deep Learning. Nové dávky pro tento kurz brzy začnou !!