Programování R - Průvodce pro začátečníky programovacím jazykem R.

Tento blog o programování R vás seznámí s programem R a pomůže vám podrobně porozumět různým základním konceptům programování R s příklady.

R je jedním z nejpopulárnějších analytických nástrojů. Ale kromě toho, že se používá pro analytiku, R je také programovací jazyk.S jeho růstem v IT průmyslu roste poptávka po kvalifikovaných nebo s porozuměním R jako obou, nástroje pro analýzu dat a programovacího jazyka.V tomto blogu vám pomůžu porozumět různým základům programování R. V našem p revious Blog ,diskutovali jsme Proč potřebujeme Analytics, Co je Business Analytics, Proč a kdo používá R.

V tomto blogu pochopíme níže uvedené základní koncepty programování R v následujícím pořadí:





  1. Proměnné
  2. Typy dat
  3. Provozovatelé dat
  4. Podmíněné prohlášení
  5. Smyčky
  6. Funkce

Můžete projít záznam webináře jazyka R Programming Language, kde náš instruktor podrobně vysvětlil témata pomocí příkladů, které vám pomohou lépe porozumět programování R.

Programování v R pro začátečníky Výukový program pro programovací jazyk R Edureka



Pojďme tedy kupředu a podívejme se na první koncept programování R - proměnné.

R Programování: Proměnné

Proměnné nejsou nic jiného než název paměťového místa obsahujícího hodnotu. Proměnná v R může ukládat číselné hodnoty, komplexní hodnoty, slova, matice a dokonce i tabulku. Překvapivé, že?

Proměnná - programování R - Edureka

Obr: Tvorbaproměnných



Výše uvedený obrázek nám ukazuje, jak jsou proměnné vytvářeny a jak jsou ukládány do různých paměťových bloků. V jazyce R nemusíme deklarovat proměnnou, než ji použijeme, na rozdíl od jiných programovacích jazyků, jako je Java, C, C ++ atd.

Pojďme kupředu a pokusme se pochopit, co je datový typ a různé datové typy podporované v R.

R Programování: datové typy

V R není proměnná sama o sobě deklarována žádného datového typu, spíše získá datový typ R objektu, který je jí přiřazen. R se tedy nazývá jazyk s dynamickým typem, což znamená, že při použití v programu můžeme datový typ stejné proměnné měnit znovu a znovu.

Datové typy určuje, jaký typ hodnoty má proměnná a jaký typ matematických, relačních nebo logických operací na ni lze použít, aniž by došlo k chybě. Existuje mnoho datových typů v R, Níže jsou však nejčastěji používané:

Pojďme nyní diskutovat o každém z těchto datových typů jednotlivě, počínaje vektory.

Vektory

Vektory jsou nejzákladnější datové objekty R a existuje šest typů atomových vektorů. Níže je uvedeno šest atomových vektorů:

Logický : Používá se k ukládání logické hodnoty jako SKUTEČNÝ nebo NEPRAVDIVÉ .

Číselné : Používá se k ukládání kladných i záporných čísel včetně reálných čísel.

jak převést dvojité na celé číslo v javě
Např .: 25, 7.1145, 96547

Celé číslo : Obsahuje všechny celočíselné hodnoty, tj. Všechna kladná a záporná celá čísla.

Např .: 45,479, -856,479, 0

Komplex : Jedná se o tvar x + yi, kde xay jsou číselné a i představuje druhou odmocninu -1.

Např .: 4 + 3i

Charakter : Slouží k uložení jednoho znaku, skupiny znaků (slov) nebo skupiny slov dohromady. Znaky mohou být definovány v jednoduchých uvozovkách nebo dvojitých uvozovkách.

Např .: „Edureka“, „R je zábava se učit“.

Obecně je vektor definován a inicializován následujícím způsobem:

Vtr = c (2, 5, 11, 24) Nebo Vtr<- c(2, 5, 11 , 24)

Pojďme se pohnout kupředu a porozumět dalším datovým typům v R.

Seznam

Seznamy jsou velmi podobné vektorům, ale Seznamy jsou objekty R, které mohou obsahovat prvky různých typů, jako jsou & minus čísla, řetězce, vektory a další seznam.

Např:

Vtr<- c('Hello', 'Hi','How are you doing') mylist <- list(Vtr, 22.5, 14965, TRUE) mylist 

Výstup:

[[1]] [1] „Dobrý den“ „Ahoj“ Jak děláš '[[2]] [1] 22,5 [[3]] [1] 14965 [[4]] [1] PRAVDA

Matice

Matice je R objekt, ve kterém jsou prvky uspořádány do dvourozměrného obdélníkového rozložení.

Základní syntaxe pro vytvoření matice v R je & minus

 matice (data, nrow, ncol, byrow, dimnames) 

Kde:

  • data je vstupní vektor, který se stává datovými prvky matice.
  • nrow je počet řádků, které se mají vytvořit.
  • ncol je počet sloupců, které se mají vytvořit.
  • byrow je logickým vodítkem. Pokud TRUE, pak jsou vstupní vektorové prvky uspořádány podle řádků.
  • dimname je názvy přiřazené řádkům a sloupcům.

Příklad:

Mymatrix<- matrix(c(1:25), nrow = 5, ncol = 5, byrow = TRUE) Mymatrix 

Výstup:

[, 1] [, 2] [, 3] [, 4] [, 5] [1,] 1 2 3 4 5 [2,] 6 7 8 9 10 [3,] 11 12 13 14 15 [4, ] 16 17 18 19 20 [5,] 21 22 23 24 25

POLE

Pole v R jsou datové objekty, které lze použít k ukládání dat ve více než dvou dimenzích. Bere vektory jako vstup a používá hodnoty v Ne parametr pro vytvoření pole.

Základní syntaxe pro vytvoření pole v R je & minus

 pole (data, dim, dimnames) 

Kde:

  • data je vstupní vektor, který se stává datovými prvky pole.
  • Ne je dimenze pole, kde předáte počet řádků, sloupců a počet matic, které mají být vytvořeny uvedenými dimenzemi.
  • dimname je názvy přiřazené řádkům a sloupcům.

Příklad:

Myarray<- array( c(1:16), dim=(4,4,2)) Myarray 

Výstup:

, , jeden [, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16 ``, 2 [, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16

Datový rámec

Datový rámec je tabulka nebo dvourozměrná struktura podobná matici, ve které každý sloupec obsahuje hodnoty jedné proměnné a každý řádek obsahuje jednu sadu hodnotprokaždý sloupec. Níže uvádíme některé vlastnosti datového rámce, které je třeba vzít v úvahu při každé práci s nimi:

  • Názvy sloupců by neměly být prázdné.
  • Každý sloupec by měl obsahovat stejné množství datových položek.
  • Data uložená v datovém rámci mohou být číselného, ​​faktorového nebo znakového typu.
  • Názvy řádků by měly být jedinečné.

Příklad:

emp_id = c (100: 104) emp_name = c ('John', 'Henry', 'Adam', 'Ron', 'Gary') dept = c ('Sales', 'Finance', 'Marketing', 'HR ',' R & D ') emp.data<- data.frame(emp_id, emp_name, dept) emp.data 

Výstup:

emp_id emp_name odd 1 100 prodejů John 2 101 Henry Finance 3 102 Adam Marketing 4 103 Ron HR 5 104 Gary R & D

Takže teď, když jsme porozuměli základním datovým typům R, je čas se do R ponořit hlouběji pochopením konceptů datových operátorů.

R Programování: Datoví operátoři

V R jsou hlavně 4 datoví operátoři, jsou to, jak je vidět níže:

Aritmetické operátory : Tyto operátory nám pomáhají provádět základní aritmetické operace, jako je sčítání, odčítání, násobení atd.

Zvažte následující příklad:

num1 = 15 num2 = 20 num3 = 0 #addition num3 = num1 + num2 num3 #substraction num3 = num1 - num2 num3 #multiplication num3 = num1 * num2 num3 #division num3 = num1 / num2 num3 # num3 = num3 = num3 #exponent num1 = 5 num2 = 3 num3 = num1 ^ num2 num3 # rozdělení podlaží num3 = num1% /% num2 num3

Výstup:

[1] 35 [patnáct [1] 300 [1] 0,75 [1] 15 [1] 125 [jedenáct

Relační operátoři : Tyto operátory nám pomáhají provádět relační operace, jako je kontrola, zda je proměnná větší než, menší než nebo rovná jiné proměnné. Výstup relační operace je vždy logická hodnota.

Zvažte následující příklady:

num1 = 15 num2 = 20 # rovná se num3 = (num1 == num2) num3 # není rovno num3 = (num1! = num2) num3 # méně než num3 = (num1 num2) num3 # méně než rovno num1 = 5 num2 = 20 num3 = (num1 = num2) num3

Výstup:

[1] NEPRAVDA [1] PRAVDA [1] PRAVDA [1] NEPRAVDA [1] PRAVDA [1] NEPRAVDA

Provozovatelé přiřazení: Tyto operátory se používají k přiřazení hodnot k proměnným v R. Přiřazení lze provést pomocí operátoru přiřazení(<-) nebo se rovná operátoru (=). Hodnotu proměnné lze přiřadit dvěma způsoby, levým přiřazením a pravým přiřazením.

LogickýProvozovatelé: Tito operátoři porovnávají tyto dvě entity a obvykle se používají s logickými (logickými) hodnotami, například „a“, „nebo“a'ne'.


R Programování: Podmíněné příkazy

  1. Pokud prohlášení: Příkaz If vám pomůže při hodnocení jediného výrazu jako součásti toku. Chcete-li provést toto vyhodnocení, stačí napsat klíčové slovo If následované výrazem, který se má vyhodnotit. Níže uvedený vývojový diagram poskytne představu o tom, jak příkaz If řídí tok kódu: Zvažte následující příklad:
num1 = 10 num2 = 20 if (num1<=num2){ print('Num1 is less or equal to Num2') 

Výstup:

[1] „Číslo 1 je menší nebo rovno číslu 2“
  • Jinak prohlášení If: Příkaz Else if vám pomůže rozšířit větve na tok vytvořený příkazem If a dá vám příležitost vyhodnotit více podmínek vytvořením nových větví toku. Níže uvedený tok vám poskytne představu o tom, jak příkaz else if větví tok kódu:

    Zvažte následující příklad:

    python def __init__
    Num1 = 5 Num2 = 20 if (Num1 Num2) {print ('Num2 is lesser than Num1')} else if ('Num1 == Num2) {print (' Num1 and Num2 are Equal ')}

    Výstup:

    [1] „Číslo 1 je menší než číslo 2“

  • Jinak prohlášení: Příkaz else se používá, když jsou všechny ostatní výrazy zkontrolovány a shledány neplatnými. Bude to poslední příkaz, který se provede jako součást větve If - Else if. Níže uvedený tok vám poskytne lepší představu o tom, jak Else mění tok kódu:

Zvažte následující příklad:

Num1 = 5 Num2 = 20 if (Num1 Num2) {print ('Num2 is lesser than Num1')} else print ('Num1 and Num2 are Equal')}

Výstup:

[1] „Čísla 1 a 2 jsou stejná“

R Programování: Smyčky

Příkaz smyčky nám umožňuje provést příkaz nebo skupinu příkazů několikrát. V R jsou hlavně 3 typy smyček:

  1. opakujte Loop : Opakuje příkaz nebo skupinu příkazů, zatímco je daná podmínka PRAVDA. Opakovaná smyčka je nejlepším příkladem smyčky řízené ukončením, kde je nejprve proveden kód a poté je zkontrolována podmínka, aby se určilo, zda by měl být ovládací prvek uvnitř smyčky nebo z ní ukončit. Níže je tok řízení v opakované smyčce:
    Podívejme se na níže uvedený příklad, abychom pochopili, jak můžeme pomocí opakovací smyčky přidat n čísel, dokud součet nedosáhne 100:

    x = 2 opakovat {x = x ^ 2 tisk (x) pokud (x> 100) {konec}

    Výstup:

    [1] 4 [1] 16 [1] 256
  2. zatímco Loop : t pomáhá opakovat příkaz nebo skupinu příkazů, zatímco je daná podmínka PRAVDA. Zatímco smyčka se ve srovnání s opakovací smyčkou mírně liší, jedná se o příklad smyčky řízené vstupem, kde je nejprve zkontrolována podmínka a pouze v případě, že je podmínka považována za pravdivou, bude ovládací prvek doručen do smyčky k provedení kódu . Níže je tok řízení ve smyčce while:
    Podívejme se na příklad níže a přidáme součet čtverců pro prvních 10 čísel a pochopíme, jak smyčka while funguje lépe:

    num = 1 sumn = 0 while (num<=11){ sumn =(sumn+ (num^2) num = num+1 print(sumn) } 


    Výstup:

    [jedenáct [patnáct [1] 14 [1] 30 [1] 55 [1] 91 [1] 140 [1] 204 [1] 285 [1] 385 [1] 506
  3. pro Loop : Používá se k opakování příkazu nebo skupiny pro pevný počet opakování. Na rozdíl od opakování a smyčky while se smyčka for používá v situacích, kdy jsme si vědomi toho, kolikrát je třeba předem provést kód. Je to podobné jako při smyčce while, kde se nejprve zkontroluje podmínka a poté se provede pouze kód zapsaný uvnitř. Podívejme se nyní na tok řízení smyčky for:

Podívejme se nyní na příklad, kde budeme pomocí smyčky for tisknout prvních 10 čísel:

pro (x v 1:10) {tisk (x)}

Výstup:

[jedenáct [1] 2 [1] 3 [1] 4 [patnáct [1] 6 [1] 7 [1] 8 [1] 9 [1] 10

R Programování: Funkce

Funkce je blok organizovaného, ​​opakovaně použitelného kódu, který se používá k provedení jediné související akce. V R existují hlavně dva typy funkcí:

Předdefinované funkce : Jedná se o vestavěné funkce, které může uživatel použít k provedení své práce Easier. Např .: mean( X) , sum( X) , čtvt ( X ), toupper( X ), atd.

Definováno uživatelem Funkce: Tyto funkce vytváří uživatel, aby splnil konkrétní požadavek uživatele. Níže je uvedena syntaxe pro vytvoření funkce vR:

 func  název_ionu  <– funkce (arg_1, arg_2 a hellip){ // Tělo funkce }

Zvažte následující příklad jednoduché funkce pro generování součtu čtvercůz2 čísla:

sum_of_square<- function(x,y) { x^2 + y^2 } sum_of_sqares(3,4) 
Výstup: [1] 25

Doufám, že se vám líbilo čtení tohoto blogu o programování R. V tomto tutoriálu jsme probrali všechny základy R, takže nyní můžete začít cvičit. Po tomto blogu o programování R přijdu s dalšími blogy o R pro Analytics, takže zůstaňte naladěni.

Nyní, když jste pochopili základy R, podívejte se na Edureka, důvěryhodná online vzdělávací společnost se sítí více než 250 000 spokojených studentů rozložených po celém světě. Školení Edureka Data Analytics with R vám pomůže získat odborné znalosti v oblasti programování R, manipulace s daty, průzkumné analýzy dat, vizualizace dat, dolování dat, regrese, analýzy sentimentu a používání RStudio pro případové studie z reálného života v oblasti maloobchodu a sociálních médií.

Máte na nás dotaz? Uveďte to prosím v sekci komentářů tohoto blogu „Programování R“ a my se vám ozveme co nejdříve.