Výukový program R - Průvodce pro začátečníky učením programování R.



Tento blog o výukovém programu R vás seznámí s nástrojem R a pomůže vám podrobně pochopit různé základy programování R s příklady.

R je nejoblíbenější nástroj pro analýzu dat, protože je otevřený, flexibilní, nabízí více balíčků a má obrovskou komunitu. Je určen pro softwarové programátory, statistiky a datové minery, a tedy, a proto vzrostl v popularitě .V tomto blogu R Tutorial vám poskytnu kompletní přehled o R s příklady.

Níže jsou uvedena témata v tomto blogu R Tutorial, o kterých budu diskutovat v následujícím pořadí:





  1. Proč potřebujeme Analytics ?
  2. Co je Business Analytics ?
  3. Proč R a kdo používá R ?
  4. Instalace R.
  5. Provozovatelé dat
  6. Typy dat
  7. Řízení toku

Výukový program R: Proč potřebujeme analýzu?

Než odpovím na otázku, dovolte mi, abych vás seznámil s některými problémy a jejich řešeními v R ve více doménách.



bankovnictví - Výukový program R - Edureka

Bankovní :

V bankách se každý den generuje velké množství údajů o zákaznících. ŽPři pravidelném jednání s miliony zákazníků je obtížné sledovat jejich hypotéky.



Řešení :

Společnost R vytváří vlastní model, který udržuje půjčky poskytované každému jednotlivému zákazníkovi, což nám pomáhá rozhodovat o částce, kterou bude zákazník v průběhu času platit.

Pojištění :

Pojištění do značné míry závisí na prognózování. Je to těžkérozhodnout, kterou politiku přijmout nebo odmítnout.

Řešení:

Použitím průběžného úvěrového reportu jako vstupu můžeme v R vytvořit model, který nejen vyhodnotí chuť k riziku, ale také vytvoří prediktivní předpověď.

Zdravotní péče:

Každý rok jsou v nemocnici přijaty miliony lidí a miliardy se ročně utratí jen za přijímací řízení.

Řešení :

Vzhledem k anamnéze pacienta a anamnéze lze vytvořit prediktivní model, který identifikuje, kdo je ohrožen hospitalizací a do jaké míry by mělo být zdravotnické vybavení měřítko.

Nyní víme, jak analýza dat pomáhá organizacím využít svá data a použít je k identifikaci nových příležitostí. Pokud mluvíme o potřebě analytiky v organizaci, musíte narazit na tyto 4 aspekty:

Dále se pojďme posunout vpřed v blogu R tutorial, kde nejprve pochopíme, co přesně je obchodní analytika.

Výukový program R: Co je Business Analytics?

Business analytics je proces zkoumání velkých souborů dat a dosažení skrytých vzorů, korelací a dalších poznatků. V zásadě vám pomůže pochopit všechna data, která jste shromáždili, ať už jde o organizační data, data o výzkumu trhu nebo produktu nebo jakýkoli jiný druh dat. Bude pro vás snadné dělat lepší rozhodnutí, lepší produkty, lepší marketingové strategie atd. Pro lepší pochopení viz níže uvedený obrázek:

Pokud se podíváte na výše uvedený obrázek, jsou vaše data na prvním obrázku rozptýlena. Nyní, pokud chcete něco konkrétního, například konkrétní záznam v databázi, stane se to těžkopádným. Chcete-li to zjednodušit, potřebujete analýzu. Díky analýze je snadné najít korelaci mezi daty. Jakmile zjistíte, co máte dělat, bude pro vás docela snadné rozhodovat se například o tom, kterou cestou se chcete vydat, nebo pokud jde o obchodní analytiku, která cesta povede ke zlepšení vaší organizace.

Ale nemůžete očekávat, že lidé ve výše uvedeném řetězci po analýze vždy pochopí nezpracovaná data, která jim poskytujete. Abychom tuto mezeru překonali, máme koncept vizualizace dat .

Vizualizace dat : Vizualizace dat je vizuální přístup k obrovskému množství dat, která jste vygenerovali po analýze. Lidská mysl zpracovává vizuální obrazy a vizuální grafiky jsou lepší než ve srovnání se surovými daty. Je pro nás vždy snadné pochopit výsečový graf nebo sloupcový graf ve srovnání se surovými čísly. Možná se ptáte, jak můžete dosáhnout této vizualizace dat z dat, která jste již analyzovali?
Na trhu pro vizualizaci dat jsou k dispozici různé nástroje:

Všichni se musíte divit, že již existuje tolik nástrojů, které vám pomohou dosáhnout vizualizace dat a určité množství analytiky, proč jít s R?

Takže moje další téma v blogu tutoriálu R se zabývá „proč R“ a „kdo používá R“.

Výukový program R: Proč R a kdo používá R?

Proč R?

R je programovací a statistický jazyk.

R se používá pro analýzu a vizualizaci dat.

R je jednoduchý a snadno se učí, čte a píše.

R je příkladem FLOSS (Free Libre a Open Source Software), kde lze volně distribuovat kopie tohoto softwaru, číst jeho zdrojový kód, upravovat jej atd.

Kdo používá R?

  • Úřad pro ochranu spotřebitele používá R pro analýzu dat
  • Statistici John Deere používají R pro modelování časových řad a geoprostorové analýzy spolehlivým a reprodukovatelným způsobem.
  • Bank of America používá R pro hlášení.
  • R je součástí technologického zásobníku za proslulým doporučovacím modulem Foursquare.
  • ANZ, čtvrtá největší banka v Austrálii, používající R pro analýzu úvěrového rizika.
  • Google používá R k předpovídání ekonomické aktivity.
  • Mozilla, nadace odpovědná za webový prohlížeč Firefox, používá R k vizualizaci webové aktivity.

Níže uvádíme některé z domén, kde se používá R:

Nyní se pojďme posunout vpřed ve výukovém blogu R a nainstalujte si R.

Výukový program R: Instalace R.

Dovolte mi, abych vás provedl procesem instalace R do vašeho systému. Postupujte podle následujících kroků:

Krok 1 : Přejít na odkaz - https://cran.r-project.org/

Krok 2 : Stáhněte a nainstalujte si do systému verzi R 3.3.3.

Pro lepší pochopení si přečtěte níže uvedený snímek obrazovky.

Podle výše uvedených kroků jste hotovi s instalační částí R. Nyní můžete přímo začít kódovat v R stažením RStudio IDE. Chcete-li si jej stáhnout, postupujte podle následujících kroků:

Krok 1 : Přejít na odkaz - https://www.rstudio.com/

Krok 2 : Stáhněte si a nainstalujte Rstudio do svého systému.

Po instalaci všeho je vše nastaveno na kód!

Výukový program pro začátečníky Výukový program pro programování R Edureka

Dále se pojďme posunout vpřed v blogu R Tutorial a pochopme, co jsou datové operátory v R.

Výukový program R: Datoví operátoři v R.

Existuje hlavně 5 různých typů operátorů, které jsou uvedeny níže:

  1. Aritmetické operátory : Provádí aritmetické operace, jako je sčítání, odčítání, násobení, dělení atd.
  2. Operátoři přiřazení :K přiřazování hodnot se používají operátory přiřazení. Například:
  • Operátor přiřazení =
    Syntax:
    název proměnné = hodnota
> x = 5 >X 
Výstup: [1] 5
  • Operátor přiřazení<-
    Syntax:
    název proměnné<- value

    > x<- 15 > x
    Výstup: [1] 15
  • Operátor přiřazení<<-
    Syntaxe:
    název proměnné<<- value
> x<<- 2 > x
Výstup: [1] 2
  • Operátor přiřazení ->
    Syntaxe:
    hodnota -> název proměnné

    > 25 -> x > x 
    Výstup: [1] 25

3. Relační operátor : Definuje vztah mezi dvěma entitami. Například: ,<=,!= etc.

> xx! = 2
Výstup:[1] PRAVDA

4. Logičtí operátoři : Tito operátoři porovnávají tyto dvě entity a obvykle se používají s logickými (logickými) hodnotami, jako je &, | a !.

> x2 a 3
Výstup:[1] PRAVDA

5. Speciální operátoři : Tyto operátory se používají ke konkrétním účelům, nikoli k logickému výpočtu. Například:

  • Vytvoří řadu čísel v pořadí pro vektor.

    > xx
    Výstup: [1] 2 3 4 5 6 7 8
  • % v% Tento operátor se používá k identifikaci, zda prvek patří do vektoru.
    Příklad

    > xyy% v% x
    Výstup: [1] PRAVDA

Výukový program R: Datové typy

Datové typy se používají k ukládání informací. V R nepotřebujeme deklarovat proměnnou jako nějaký datový typ. Proměnné jsou přiřazeny R-objektům a datový typ R-objektu se stává datovým typem proměnné.V R je přítomno hlavně šest datových typů:

Pojďme se podrobněji zabývat každým z nich:

Vektor : Vektor je posloupnost datových prvků stejného základního typu. Příklad:

vtr = (1, 3, 5, 7 9)

nebo

vtr<- (1, 3, 5 ,7 9)

Existuje 5 atomových vektorů, označovaných také jako pět tříd vektorů.

Seznam : Seznamy jsou objekty R, které obsahují prvky různých typů, jako jsou & minus čísla, řetězce, vektory a další seznam v nich.

> n = c (2, 3, 5) > s = c ('aa', 'bb', 'cc', 'dd', 'ee') > x = seznam (n, s, PRAVDA) > x

Výstup -

[[1]] [1] 2 3 5 [[2]] [1] 'aa' 'bb' 'cc' 'dd' 'ee' [[3]] [1] PRAVDA

Pole : Pole jsou datové objekty R, které mohou ukládat data ve více než dvou dimenzích. Vezme vektory jako vstup a použije hodnoty v parametru dim k vytvoření pole.

vektor1<- c(5,9,3) vektor2<- c(10,11,12,13,14,15) výsledek<- array(c(vector1,vector2),dim = c(3,3,2))

Výstup -

,, 1 [, 1] [, 2] [, 3] [1,] 5 10 13 [2,] 9 11 14 [3,] 3 12 15 ,, 2 [, 1] [, 2] [, 3 ] [1,] 5 10 13 [2,] 9 11 14 [3,] 3 12 15

Pole : Matice jsou objekty R, ve kterých jsou prvky uspořádány do dvourozměrného obdélníkového rozložení. Matice je vytvořena pomocí funkce matrix (). Příklad: matice (data, nrow, ncol, byrow, dimnames) kde,

data je vstupní vektor, který se stává datovými prvky matice.

nrow je počet řádků, které se mají vytvořit.

ncol je počet sloupců, které se mají vytvořit.

byrow je logickým vodítkem. Pokud TRUE, pak jsou vstupní vektorové prvky uspořádány podle řádků.

dimname je názvy přiřazené řádkům a sloupcům.

> Mat<- matrix(c(1:16), nrow = 4, ncol = 4 ) > Mat
Výstup :
[, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16

Faktory : Faktory jsou datové objekty, které se používají ke kategorizaci dat a jejich ukládání jako úrovní. Mohou ukládat řetězce i celá čísla. Jsou užitečné při analýze dat pro statistické modelování.

> data<- c('East','West','East','North','North','East','West','West“,'East“) > factor_data<- factor(data) > factor_data

Výstup :

[1] East West East North North East West West East Úrovně: východ severozápad

Datové rámce : Datový rámec je tabulka nebo dvourozměrná struktura podobná matici, ve které každý sloupec obsahuje hodnoty jedné proměnné a každý řádek obsahuje jednu sadu hodnot z každého sloupce.

> std_id = c (1: 5) > std_name = c ('Rick', 'Dan', 'Michelle', 'Ryan', 'Gary') > známky = c (623,3 515,2 611,0 729,0 843,25) > std.data<- data.frame(std_id, std_name, marks) > std.data

Výstup :

std_id std_name značky 1 1 Rick 623,30 2 2 A 515.20 3 3 Michelle 611,00 4 4 Ryan 729,00 5 5 Gary 843,25

Tím se dostáváme na konec různých datových typů v R. Dále se pojďme posunout vpřed v blogu R Tutorial a pochopit další klíčový koncept - příkazy řízení toku.

Výukový program R: Prohlášení o řízení toku

Příkazy řízení toku hrají velmi důležitou roli, protože vám umožňují řídit tok provádění skriptu uvnitř funkce. Nejčastěji používané příkazy řízení toku jsou znázorněny na následujícím obrázku:

Nyní pojďme diskutovat o každém z nich s příklady.

Výukový program R: Výkazy selektoru

  • Pokud kontrolní prohlášení : Tento kontrolní příkaz vyhodnotí jednu podmínku. Je to docela snadné, protože má pouze jedno klíčové slovo „if“, za kterým následuje podmínka a poté určitá sada příkazů, které je třeba provést, pokud je to pravda. Chcete-li lépe porozumět, podívejte se na níže uvedený vývojový diagram:

V tomto vývojovém diagramu bude kód reagovat následujícím způsobem:

  1. Nejprve vstoupí do smyčky, kde zkontroluje stav.
  2. Pokud je podmínka pravdivá, bude proveden podmíněný kód nebo zapsané příkazy.
  3. Pokud je podmínka nepravdivá, příkazy budou ignorovány.

Níže je uveden příklad -li kontrolní příkaz v R. Zkuste spustit tento příklad v R Studio.

x = 2 opakovat {x = x ^ 2 tisk (x) pokud (x> 100) {konec}

Výstup :

[1] 4 [1] 16 [1] 256
  • If Else Control Statement :Zkouškas typ kontrolního prohlášenívyhodnotí skupinu podmínek a vybere výkazy. Chcete-li lépe porozumět, podívejte se na níže uvedený vývojový diagram:

V tomto vývojovém diagramu bude kód reagovat následujícím způsobem:

  1. Nejprve vstoupí do smyčky, kde zkontroluje stav.
  2. Pokud je podmínka pravdivá, budou provedeny první příkazy „if“.
  3. Pokud je podmínka nepravdivá, přejde na podmínku ‚else if 'a pokud je pravdivá, bude proveden kód‚ else if'.
  4. Nakonec, pokud je kód „else if“ také nepravdivý, přejde na kód „else“ a bude spuštěn. To znamená, že pokud není splněna žádná z těchto podmínek, bude proveden příkaz ‚else‘.

Níže je uveden příklad pokud jinde kontrolní příkaz v R. Zkuste spustit tento příklad v R Studio.

x5) {print ('x je větší než 5')} elseif (x == 5) {print ('x je rovno 5')} else {print ('x není větší než 5')}

Výstup:

[1] „x se rovná 5“
  • Přepnout výpisy : Tyto kontrolní příkazy se v zásadě používají k porovnání určitého výrazu se známou hodnotou. Chcete-li lépe porozumět, podívejte se na níže uvedený vývojový diagram:

V tomto vývojovém diagramu případu přepínače bude kód reagovat v následujících krocích:

  1. Nejprve to vstoupí do přepínače, který má výraz.
  2. Dále přejde na podmínku Případ 1, zkontroluje hodnotu předanou podmínce. Pokud je to pravda, blok příkazů se provede. Poté se to zlomí z té spínací skříňky.
  3. V případě, že je nepravdivý, přepne se na další případ. Pokud je podmínka případu 2 pravdivá, provede příkaz a oddělí se od tohoto případu, jinak znovu přeskočí na další případ.
  4. Řekněme, že jste nezadali žádný případ, nebo došlo k nějakému nesprávnému zadání od uživatele, pak přejde do výchozího případu, kde bude vytištěn váš výchozí příkaz.

Níže je příklad příkazu switch v R. Zkuste spustit tento příklad v R Studio.

vtr<- c(150,200,250,300,350,400) option <-'mean' switch(option, 'mean' = print(mean(vtr)), 'mode' = print(mode((vtr))), 'median' = print(median((vtr))) ) 

Výstup :

[1] 275

Výukový program R: Smyčkové příkazy

Smyčky vám pomohou opakovat určitou sadu akcí, abyste je nemuseli provádět opakovaně. Představte si, že musíte provést operaci 10krát, pokud pokaždé začnete psát kód, prodlužuje se délka programu a bylo by pro vás těžké to později pochopit. Ale zároveň pomocí smyčky, pokud napíšu stejný příkaz uvnitř smyčky, šetří to čas a usnadňuje čitelnost kódu. Rovněž se optimalizuje s ohledem na účinnost kódu.

Na obrázku výše opakovat' a ' zatímco „Příkazy vám pomohou provést určitou sadu pravidel, dokud podmínka není pravdivá, ale“ pro' je příkaz smyčky, který se používá, když víte, kolikrát chcete opakovat blok příkazu. Nyní, pokud víte, že to chcete opakovat 10krát, pak použijete příkaz 'pro', ale pokud si nejste jisti, kolikrát chcete kód opakovat, použijete 'opakovat' nebo smyčka „while“.

Promluvme si o každém z nich na příkladech.

  • Opakovat : Smyčka opakování pomáhá znovu a znovu spouštět stejnou sadu kódu, dokud není splněna podmínka zastavení. Chcete-li lépe porozumět, podívejte se na níže uvedený vývojový diagram:

Ve výše uvedeném vývojovém diagramu bude kód reagovat v následujících krocích:

  1. Nejprve zadá a provede sadu kódu.
  2. Dále zkontroluje podmínku, pokud je pravdivá, vrátí se zpět a znovu provede stejnou sadu kódu, dokud nebude zamýšlena jako nepravdivá.
  3. Pokud se zjistí, že je nepravdivý, smyčku přímo opustí.
  • Zatímco : Příkaz while také pomáhá znovu a znovu spouštět stejnou sadu kódu, dokud není splněna podmínka zastavení. Chcete-li lépe porozumět, podívejte se na níže uvedený vývojový diagram:

Ve výše uvedeném vývojovém diagramu bude kód reagovat v následujících krocích:

  1. Nejprve zkontroluje stav.
  2. Pokud se zjistí, že je to pravda, provede sadu kódu.
  3. Dále znovu zkontroluje podmínku, pokud je její pravda, provede stejný kód znovu. Jakmile se zjistí, že podmínka je nepravdivá, okamžitě smyčku opustí.

Níže je příklad příkazu while v R. Zkuste spustit tento příklad v R Studio.

x = 2 while (x<1000) { x=x^2 print(x) } 

Výstup:

výukové programy pro Microsoft SQL Server pro začátečníky
4 16 256 65 536

Určitě vás zajímá, jak se tyto dvě tvrzení liší? Dovolte mi vyjasnit vaše pochybnosti!
Zde je hlavní rozdíl mezi příkazem repeat a while v tom, že se mění s ohledem na váš stav. Zatímco smyčka v podstatě definuje, kdy se chystáte vstoupit do smyčky k provedení příkazů a opakovat smyčka definuje, kdy opustíte smyčku po provedení příkazů. Takže tyto dva příkazy jsou známé jako vstupní kontrolní smyčka a výstupní kontrolní smyčka. Tak se liší výroky while a repeat.

  • Pro smyčku: Pro smyčky se používají, když potřebujete několikrát spustit blok kódu. Chcete-li lépe porozumět, podívejte se na níže uvedený vývojový diagram:

Ve výše uvedeném vývojovém diagramu bude kód reagovat v následujících krocích:

  1. Nejprve je to inicializace, kde určíte, kolikrát se má smyčka opakovat.
  2. Dále zkontroluje stav. Pokud je podmínka pravdivá, provede sadu kódu pro zadaný počet opakování.
  3. Jakmile se zjistí, že podmínka je nepravdivá, okamžitě smyčku opustí.

Níže je příklad příkazu for v R. Zkuste spustit tento příklad v R Studio.

vtr<- c(7,19,25,65, 45) for( i in vtr) { print(i) } 

Výstup :

7 19 25 65 45

Dále přejděte k naší poslední sadě příkazů v blogu R Tutorial, tj. Skokové příkazy.

Výukový program R: Přejít na příkazy

Prohlášení o přestávce : Příkazy Break pomáhají ukončit program a obnoví řízení na další příkaz následující po smyčce. Tyto příkazy se také používají v případě přepínače. Chcete-li lépe porozumět, podívejte se na níže uvedený vývojový diagram:

Ve výše uvedeném vývojovém diagramu bude kód reagovat v následujících krocích:

  1. Nejprve vstoupí do smyčky, kde zkontroluje stav.
  2. Pokud je podmínka smyčky nepravdivá, smyčku přímo opustí.
  3. Pokud je podmínka pravdivá, zkontroluje podmínku přerušení.
  4. Pokud je podmínka přerušení pravdivá, existuje ze smyčky.
  5. Pokud je podmínka přerušení nepravdivá, provede příkazy, které zůstanou ve smyčce, a poté zopakuje stejné kroky.

Níže je uveden příklad příkazu jump v R. Zkuste spustit tento příklad v R Studio.

X<- 1:5 for (val in x) { if (val == 3){ break } print(val) } 

Výstup:

[1] 1 [1] 2

Další prohlášení : Další příkaz se používá, když chcete přeskočit aktuální iteraci smyčky bez jejího ukončení. Další výrok je docela podobný výrazu „continue“ v jiném programovacím jazyce. Chcete-li lépe porozumět, podívejte se na níže uvedený vývojový diagram:

Ve výše uvedeném vývojovém diagramu bude kód reagovat v následujících krocích:

  1. Nejprve vstoupí do smyčky, kde zkontroluje stav.

  2. Pokud je podmínka smyčky nepravdivá, smyčku přímo opustí.

  3. Pokud je podmínka smyčky pravdivá, provede příkazy bloku 1.

  4. Poté zkontroluje „další“ prohlášení. Pokud je přítomen, pak se příkazy poté nebudou provádět ve stejné iteraci smyčky.

  5. Pokud není k dispozici příkaz „další“, budou provedeny všechny následující příkazy.

Níže je příklad dalšího příkazu v R. Zkuste spustit tento příklad v R Studio.

for (i in 1:15) {if ((i %% 2) == 0) {next} print (i)}

Výstup :

1 3 5 7 9 11 13 15

Toto je konec výukového blogu R. Doufám, že máte jasno v každém konceptu, o kterém jsem hovořil výše. Zůstaňte naladěni, můj další blog bude o tréninku R, kde podrobně vysvětlím některé další koncepty R s exdostatek.

Nyní, když jste pochopili základy R, podívejte se na Edureka, důvěryhodná online vzdělávací společnost se sítí více než 250 000 spokojených studentů po celém světě. Školení Edureka Data Analytics with R vám pomůže získat odborné znalosti v oblasti programování R, manipulace s daty, průzkumné analýzy dat, vizualizace dat, dolování dat, regrese, analýzy sentimentu a používání R Studio pro případové studie v reálném životě v oblasti maloobchodu a sociálních médií.

Máte na nás dotaz? Uveďte to prosím v sekci komentářů tohoto blogu „R Tutorial“ a my se vám ozveme co nejdříve.