R programavimas - pradedančiųjų R programavimo kalbos vadovas



Šis tinklaraštis apie R programavimą supažindina jus su R ir padeda jums išsamiai suprasti įvairias pagrindines R programavimo sąvokas su pavyzdžiais.

R yra vienas populiariausių analizės įrankių. Bet ne tik naudojama analizei, bet ir R yra programavimo kalba.Augant IT pramonei, auga paklausa kvalifikuotų ar suprantant R kaip duomenų analizės įrankį ir programavimo kalbą.Šiame tinklaraštyje aš padėsiu jums suprasti įvairius R programavimo pagrindus. Mūsų p žvalus Tinklaraštis ,aptarėme, kam mums reikalinga „Analytics“, kas yra verslo analizė, kodėl ir kas naudoja R.

Šiame tinklaraštyje mes suprasime toliau pateiktas pagrindines R programavimo sąvokas tokia seka:





  1. Kintamieji
  2. Duomenų tipai
  3. Duomenų operatoriai
  4. Sąlyginis pareiškimas
  5. Kilpos
  6. Funkcijos

Galite apsilankyti R programavimo kalbos internetiniame seminare, kur mūsų instruktorius išsamiai paaiškino temas su pavyzdžiais, kurie padės geriau suprasti R programavimą.

R programavimas pradedantiesiems R Programavimo kalbos mokymo programa Edureka



Taigi eikime į priekį ir pažvelkime į pirmąją R programavimo koncepciją - kintamuosius.

R programavimas: kintamieji

Kintamieji yra ne kas kita, kaip pavadinimas atminties vietai, kurioje yra vertė. R kintamasis gali išsaugoti skaitines reikšmes, sudėtingas vertes, žodžius, matricas ir net lentelę. Stebina, tiesa?

Kintamasis - R programavimas - „Edureka“

Pav .: Kūrybakintamųjų



Aukščiau pateiktame paveikslėlyje parodyta, kaip yra sukuriami kintamieji ir kaip jie saugomi skirtinguose atminties blokuose. R, mes neturime deklaruoti kintamojo prieš jį naudodami, skirtingai nei kitos programavimo kalbos, tokios kaip Java, C, C ++ ir kt.

Judėkime į priekį ir pabandykime suprasti, kas yra duomenų tipas ir įvairūs duomenų tipai, palaikomi R.

R programavimas: duomenų tipai

R atveju pats kintamasis nėra deklaruojamas jokiu duomenų tipu, greičiau jis gauna jam priskirto R objekto duomenų tipą. Taigi R vadinama dinamiškai įvesta kalba, o tai reiškia, kad mes galime vėl ir vėl pakeisti to paties kintamojo duomenų tipą, kai jį naudojame programoje.

Duomenų tipai nurodo, kokio tipo reikšmę turi kintamasis ir kokias matematines, reliacines ar logines operacijas jam galima pritaikyti nesukeliant klaidos. R yra daug duomenų tipų, tačiau toliau pateikiami dažniausiai naudojami:

Aptarkime kiekvieną iš šių duomenų tipų atskirai, pradedant nuo „Vektoriai“.

Vektoriai

Vektoriai yra patys pagrindiniai R duomenų objektai ir yra šeši atominių vektorių tipai. Žemiau yra šeši atominiai vektoriai:

Logiška : Jis naudojamas saugoti loginę vertę kaip TIESA arba NETIESA .

Skaitmeninis : Jis naudojamas saugoti tiek teigiamus, tiek neigiamus skaičius, įskaitant tikrąjį skaičių.

Pvz .: 25, 7.1145, 96547

Sveikasis skaičius : Joje yra visos sveikojo skaičiaus reikšmės, ty visi teigiami ir neigiami sveiki skaičiai.

Pvz .: 45.479, -856.479, 0

Kompleksas : Tai yra formos x + yi, kur x ir y yra skaitiniai, o i reiškia kvadratinę šaknį -1.

Pvz .: 4 + 3i

Charakteris : Jis naudojamas saugoti vieną simbolį, simbolių (žodžių) grupę arba žodžių grupę kartu. Simboliai gali būti apibrėžti vienkartinėmis arba dvigubomis kabutėmis.

Pvz .: „Edureka“, „R yra smagu mokytis“.

Paprastai vektorius apibrėžiamas ir inicijuojamas taip:

Vtr = c (2, 5, 11, 24) Arba Vtr<- c(2, 5, 11 , 24)

Pažvelkime į priekį ir supraskime kitus R duomenų tipus.

Sąrašas

Sąrašai yra gana panašūs į vektorius, tačiau sąrašai yra R objektai, kuriuose gali būti įvairių tipų elementų, tokių kaip & minus numeriai, eilutės, vektoriai ir dar vienas sąrašas jo viduje.

Pvz .:

Vtr<- c('Hello', 'Hi','How are you doing') mylist <- list(Vtr, 22.5, 14965, TRUE) mylist 

Išvestis:

[[1]] [1] Sveiki, Sveiki, kaip ar darai “[[2]] [1] 22.5 [[3]] [1] 14965 [[4]] [1] TIKRA

Matrica

Matrica yra R objektas, kuriame elementai yra išdėstyti dvimatis stačiakampis išdėstymas.

Pagrindinė R matricos sukūrimo sintaksė yra & minusas

 matrica (duomenys, nrow, ncol, byrow, dimnames) 

Kur:

  • duomenis yra įvesties vektorius, kuris tampa matricos duomenų elementais.
  • dabar yra sukuriamų eilučių skaičius.
  • ncol yra sukuriamų stulpelių skaičius.
  • byrow yra logiška nuoroda. Jei TIESA, tada įvesties vektoriaus elementai yra išdėstyti pagal eilutes.
  • blankus vardas yra eilutėms ir stulpeliams priskirti pavadinimai.

Pavyzdys:

„Mymatrix“<- matrix(c(1:25), nrow = 5, ncol = 5, byrow = TRUE) Mymatrix 

Išvestis:

[, 1] [, 2] [, 3] [, 4] [, 5] [1,] 1 2 3 4 5 [2,] 6 7 8 9 10 [3,] 11 12 13 14 15 [4, ] 16 17 18 19 20 [5,] 21 22 23 24 25

ARRAY

R masyvai yra duomenų objektai, kuriuos galima naudoti duomenims saugoti daugiau nei dviem aspektais. Jis ima vektorius kaip įvestį ir naudoja reikšmes ne parametras masyvui sukurti.

Pagrindinė R masyvo kūrimo sintaksė yra & minusas

 masyvas (duomenys, blankūs, slapyvardžiai) 

Kur:

  • duomenis yra įvesties vektorius, kuris tampa masyvo duomenų elementais.
  • ne yra masyvo matmuo, kur perduodate eilučių, stulpelių skaičių ir matricų, kurias reikia sukurti pagal minėtus matmenis, skaičių.
  • blankus vardas yra eilutėms ir stulpeliams priskirti pavadinimai.

Pavyzdys:

Myarray<- array( c(1:16), dim=(4,4,2)) Myarray 

Išvestis:

,, vienas [, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16 ,, 2 [, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16

Duomenų rėmas

Duomenų rėmas yra lentelė arba į dvimatę masyvą panaši struktūra, kurioje kiekviename stulpelyje yra vieno kintamojo vertės, o kiekvienoje eilutėje - vienas verčių rinkinys.dėlkiekvieno stulpelio. Toliau pateikiamos kelios duomenų rėmelio savybės, į kurias reikia atsižvelgti kiekvieną kartą, kai dirbame su jomis:

  • Stulpelių pavadinimai neturi būti tušti.
  • Kiekviename stulpelyje turėtų būti tiek pat duomenų elementų.
  • Duomenų rėmelyje saugomi duomenys gali būti skaitiniai, faktoriai arba simbolių tipo.
  • Eilučių pavadinimai turėtų būti unikalūs.

Pavyzdys:

emp_id = c (100: 104) emp_name = c ('John', 'Henry', 'Adam', 'Ron', 'Gary') dept = c ('Pardavimai', 'Finansai', 'Rinkodara', 'HR „, MTEP“) duomenys<- data.frame(emp_id, emp_name, dept) emp.data 

Išvestis:

rubino ant bėgių interneto programa
emp_id emp_name skyrius 1 100 John Sales 2 101 Henriko finansai 3 102 „Adam Marketing“ 4 103 Ron HR 5 104 Gary moksliniai tyrimai ir plėtra

Taigi dabar, kai supratome pagrindinius R duomenų tipus, laikas gilintis į R, suprasdami duomenų operatorių sąvokas.

R programavimas: duomenų operatoriai

R yra daugiausia 4 duomenų operatoriai, jie matomi toliau:

Aritmetikos operatoriai : Šie operatoriai padeda mums atlikti pagrindines aritmetines operacijas, pvz., Sudėjimą, atimimą, dauginimą ir kt.

„Java“ eilutė padalijo kelis skiriklius

Apsvarstykite šį pavyzdį:

num1 = 15 num2 = 20 num3 = 0 #papildymas num3 = num1 + num2 num3 #substrakcija num3 = num1 - num2 num3 #sudaugintinis num3 = num1 * num2 num3 #division num3 = num1 / num2 num3 #modulus num3 = num1 %% num2 num3 #exponent num1 = 5 num2 = 3 num3 = num1 ^ num2 num3 #grindos padalinys num3 = num1% /% num2 num3

Išvestis:

[1] 35 [penkiolika [1] 300 [1] 0,75 [1] 15 [1] 125 [vienuolika

Ryšių operatoriai : Šie operatoriai padeda mums atlikti reliacines operacijas, pavyzdžiui, patikrinti, ar kintamasis yra didesnis, mažesnis ar lygus kitam kintamajam. Reliacinės operacijos išvestis visada yra loginė reikšmė.

Apsvarstykite šiuos pavyzdžius:

num1 = 15 num2 = 20 # yra lygus num3 = (num1 == num2) num3 #nėra lygus num3 = (num1! = num2) num3 #ne mažiau nei num3 = (num1 num2) num3 #nėra lygus num1 = 5 num2 = 20 num3 = (num1 = num2) num3

Išvestis:

[1] NETIESA [1] TIKRA [1] TIKRA [1] NETIESA [1] TIKRA [1] NETIESA

Užduočių operatoriai: Šie operatoriai naudojami priskirti reikšmes kintamiesiems R. Priskyrimas gali būti atliekamas naudojant bet kurį priskyrimo operatorių(<-) arba lygus operatoriui (=). Kintamojo reikšmę galima priskirti dviem būdais: kairiuoju ir dešiniuoju.

LogiškaOperatoriai: Šie operatoriai palygina du objektus ir paprastai naudojami su loginėmis (loginėmis) reikšmėmis, tokiomis kaip „ir“, „arba“ir„Ne“.


R programavimas: sąlyginiai teiginiai

  1. Jei teiginys: „If“ sakinys padeda įvertinti vieną išraišką kaip srauto dalį. Norėdami atlikti šį vertinimą, jums tiesiog reikia parašyti „If“ raktinį žodį ir vertinamą išraišką. Žemiau pateiktoje srauto schemoje bus pateikta idėja, kaip sakinys „If“ valdo kodo srautą: Apsvarstykite šį pavyzdį:
num1 = 10 num2 = 20 if (num1<=num2){ print('Num1 is less or equal to Num2') 

Išvestis:

[1] „Num1 yra mažesnis arba lygus Num2“
  • Kitas „If“ pareiškimas: „Else if“ sakinys padeda išplėsti šakas į „If“ sakinio sukurtą srautą ir suteikia galimybę įvertinti kelias sąlygas kuriant naujas srauto šakas. Žemiau pateiktas srautas suteiks jums idėją, kaip kitas, jei sakinys, šakoja kodo srautą:

    Apsvarstykite šį pavyzdį:

    Num1 = 5 Num2 = 20 if (Num1 Num2) {print ('Num2 yra mažesnis nei Num1')} kitas, jei ('Num1 == Num2) {print (' Num1 ir Num2 yra lygūs ')}

    Išvestis:

    [1] „Num1 yra mažesnis nei Num2“

  • Kitas pareiškimas: Kitas sakinys naudojamas, kai visos kitos išraiškos yra patikrintos ir nustatytos kaip negaliojančios. Tai bus paskutinis sakinys, kuris bus vykdomas kaip filialo „If-Else if“ dalis. Žemiau pateiktas srautas suteiks jums geresnę idėją, kaip „Else“ keičia kodo srautą:

Apsvarstykite šį pavyzdį:

Num1 = 5 Num2 = 20 if (Num1 Num2) {print ('Num2 yra mažesnis nei Num1')} kitas spausdinimas ('Num1 ir Num2 yra lygūs')}

Išvestis:

[1] „Num1 ir Num2 yra lygūs“

R programavimas: kilpos

Ciklo sakinys leidžia mums kelis kartus vykdyti teiginį ar teiginių grupę. R daugiausia yra 3 tipų kilpos:

  1. pakartokite kilpą : Jis pakartoja teiginį ar teiginių grupę, o tam tikra sąlyga yra TIESA. Pakartojimo ciklas yra geriausias išėjimo valdomos kilpos pavyzdys, kai kodas pirmiausia vykdomas, o tada tikrinama sąlyga, siekiant nustatyti, ar valdiklis turėtų būti ciklo viduje, ar išeiti iš jo. Žemiau yra valdymo srautas pakartotinėje kilpoje:
    Pažvelkime į toliau pateiktą pavyzdį, kad suprastume, kaip mes galime naudoti pakartojimo ciklą, kad pridėtume n skaičių, kol suma viršys 100:

    x = 2 pakartokite {x = x ^ 2 spausdinti (x), jei (x> 100) {pertrauka}

    Išvestis:

    [1] 4 [1] 16 [1] 256
  2. o kilpa : t padeda pakartoti teiginį ar teiginių grupę, o tam tikra sąlyga yra TIESA. Nors ciklas, palyginti su pakartojimo ciklu, yra šiek tiek kitoks, tai yra įvesties kontroliuojamos kilpos pavyzdys, kai pirmiausia tikrinama sąlyga, ir tik tada, jei nustatoma, kad sąlyga yra teisinga, valdymas pristatomas ciklo viduje, kad įvykdytų kodą . Žemiau yra valdymo srautas per tam tikrą laiką:
    Pažvelkime į žemiau pateiktą pavyzdį, kad pridėtume pirmųjų 10 skaičių kvadratų sumą ir suprastume, kaip „while“ kilpa veikia geriau:

    num = 1 sumn = 0, o (skaičius<=11){ sumn =(sumn+ (num^2) num = num+1 print(sumn) } 


    Išvestis:

    [vienuolika [penkiolika [1] 14 [1] 30 [1] 55 [1] 91 [1] 140 [1] 204 [1] 285 [1] 385 [1] 506
  3. už „Loop“ : Jis naudojamas pakartoti teiginį ar grupę fiksuotą skaičių kartų. Skirtingai nuo pakartojimo ir „loop“, „for loop“ naudojamas tais atvejais, kai mes žinome, kiek kartų kodą reikia atlikti iš anksto. Tai panašu į „loop“, kur pirmiausia patikrinama sąlyga, o tada įvykdomas tik viduje parašytas kodas. Leidžia dabar pamatyti ciklo valdymo srautą:

Dabar pažvelkime į pavyzdį, kuriame mes naudosime „for loop“, kad atspausdintume pirmuosius 10 skaičių:

(x per 1:10) {spausdinti (x)}

Išvestis:

[vienuolika [1] 2 [1] 3 [1] 4 [penkiolika [1] 6 [1] 7 [1] 8 [1] 9 [1] 10

R programavimas: funkcijos

Funkcija yra sutvarkyto, daugkartinio naudojimo kodo blokas, naudojamas vienam susijusiam veiksmui atlikti. R yra daugiausia dviejų tipų funkcijos:

Iš anksto nustatytos funkcijos : Tai yra įmontuotos funkcijos, kurias vartotojas gali naudoti savo darbui atlikti lengviausiar. Pvz .: mean( x) , sum( x) , kvrt ( x ), viršutinis( x ) ir kt.

Vartotojo apibrėžta Funkcijos: Šias funkcijas sukuria vartotojas, kad atitiktų konkretų vartotojo reikalavimą. Žemiau yra sintaksė kuriant funkcijąR:

 func  srities_vardas  <– funkcija (arg_1, arg_2 ir hellip){ // Funkcijos kūnas }

Apsvarstykite šį paprastos funkcijos pavyzdį kvadratų sumai generuotiapie2 numeriai:

kvadrato suma<- function(x,y) { x^2 + y^2 } sum_of_sqares(3,4) 
Rezultatas: [1] 25

Tikiuosi, kad jums patiko skaityti šį R programavimo tinklaraštį. Šioje pamokoje apžvelgėme visus R pagrindus, todėl galite pradėti praktikuoti jau dabar. Po šio „R“ programavimo tinklaraščio aš sugalvosiu daugiau tinklaraščių „R“, skirtame „Analytics“, todėl sekite naujienas.

Dabar, kai supratote R pagrindus, patikrinkite sukūrė patikima internetinė mokymosi įmonė „Edureka“, turinti daugiau nei 250 000 patenkintų besimokančiųjų tinklą visame pasaulyje. „Edureka“ „Data Analytics with R“ mokymai padės jums įgyti žinių apie R programavimą, duomenų valdymą, tiriamąją duomenų analizę, duomenų vizualizavimą, duomenų gavybą, regresiją, sentimentų analizę ir „RStudio“ naudojimą realių atvejų mažmeninės prekybos, socialinės žiniasklaidos srityse.

Turite mums klausimą? Prašau tai paminėti šio „R programavimo“ tinklaraščio komentarų skyriuje, ir mes kuo greičiau susisieksime su jumis.