Kokios yra mašininio mokymosi sąlygos?

Šis tinklaraštis apie būtinas mašininio mokymosi sąlygas padės jums suprasti pagrindines sąvokas, kurias turite žinoti prieš pradėdami naudotis mašininiu mokymusi.

Mašinų mokymasis yra neabejotinai paklausiausia šio laikmečio technologija! Jei esate pradedantysis ir pradedate naudotis mašininiu mokymusi, svarbu žinoti būtinas mašininio mokymosi sąlygas. Šis tinklaraštis padės jums suprasti įvairias sąvokas, kurias turite žinoti prieš pradėdami naudoti mašininį mokymąsi.

Norėdami gauti išsamių žinių apie dirbtinį intelektą ir mašininį mokymąsi, galite užsiregistruoti tiesiogiai sukūrė „Edureka“ su parą visą parą ir visą gyvenimą.





Štai temų sąrašas aprašyta šiame tinklaraštyje:

  1. Mašininio mokymosi prielaidos
  2. Mašininio mokymosi supratimas su naudojimo atveju

Mašininio mokymosi prielaidos

Norėdami pradėtiMašininis mokymasis turi būti žinomas šiomis sąvokomis:



  1. Statistika
  2. Tiesinė algebra
  3. Skaičiavimas
  4. Tikimybė
  5. Programavimo kalbos

Statistika

Statistikoje yra įrankių, kuriuos galima naudoti norint gauti tam tikrų duomenų rezultatų. Yra aprašomoji statistika, kuri naudojama neapdorotiems duomenims pakeisti svarbioje informacijoje. Be to, išvestinę statistiką galima naudoti norint gauti svarbią informaciją iš duomenų pavyzdžio, o ne naudoti visą duomenų rinkinį.

Norėdami sužinoti daugiau apie Statistiką galite peržiūrėti šiuose tinklaraščiuose:

Tiesinė algebra

Tiesinės algebros pasiūlymaisu vektoriais, matricomis ir tiesinėmis transformacijomis. Tai labai svarbu mokantis mašinoje, nes jis gali būti naudojamas duomenų rinkiniui transformuoti ir atlikti operacijas.



Skaičiavimas

Skaičiavimas yra svarbi matematikos sritis ir jis atlieka neatsiejamą vaidmenį daugelyje mašininio mokymosi algoritmų. Duomenų rinkinys, turintis kelias funkcijas, yranaudojamas kuriant mašininio mokymosi modelius, nes ypatybės yra daugybė įvairių variantų, skaičiavimas vaidina svarbų vaidmenį kuriant mašininio mokymosi modelį. Integracijos ir diferenciacijos yra būtinos.

Tikimybė

Tikimybė padeda numatyti įvykių tikimybę, ji padeda mums pagrįsti situacijos pasikartojimą. Mašinų mokymuisi tikimybė yra a pamatai.

Mathematics

Norėdami sužinoti daugiau apie tikimybę, galite tai išgyventi Tinklaraštis.

kas yra kvadoopas hadope

Programavimo kalba

Norint įgyvendinti visą mašininio mokymosi procesą, būtina žinoti tokias programavimo kalbas kaip R ir Python. „Python“ ir „R“ teikia įmontuotas bibliotekas, kurios leidžia labai lengvai įdiegti „Machine Learning“ algoritmus.

Be pagrindinių programavimo žinių, taip pat svarbu žinoti, kaip išgauti, apdoroti ir analizuoti duomenis. Tai yra vienas iš svarbiausių įgūdžių, reikalingų mašininiam mokymuisi.

Norėdami sužinoti daugiau apie programavimą mašininio mokymosi kalbomis, galite peržiūrėti šiuos tinklaraščius:

  1. Geriausios „Python“ bibliotekos duomenų mokslui ir mašininiam mokymuisi

Mašininio mokymosi naudojimo atvejis

Mašininis mokymasis yra sukurti algoritmą, kuris galėtų pasimokyti iš duomenų, kad būtų galima numatyti, kokie objektai yra paveikslėlyje, ar rekomendacijų variklis, geriausias vaistų derinys tam tikrai ligai išgydyti ar šlamšto filtravimas.

Mašininis mokymasis grindžiamas matematinėmis prielaidomis ir, jei žinote, kodėl matematika naudojama mokantis mašinoje, tai bus smagu. Turite žinoti matematiką, susijusią su funkcijomis, kurias naudosite, ir koks modelis tinka duomenims ir kodėl.

Taigi pradėkime nuo įdomios būsto kainų prognozavimo problemos, turėdami duomenų rinkinį, kuriame pateikiama įvairių savybių ir kainų istorija, kol kas apsvarstysime gyvenamojo ploto plotą kvadratinėmis pėdomis ir kainas.

Dabar turime duomenų rinkinį, kuriame yra du stulpeliai, kaip parodyta žemiau:

Turi būti tam tikra koreliacija tarp šių dviejų kintamųjų, kad sužinotume, jog mums reikės sukurti modelį, kuris leistų numatyti namų kainą, kaip tai padaryti?

Nubraižykime šiuos duomenis ir pažiūrėkime, kaip jie atrodo:

Čia X ašis yra gyvenamojo ploto kvadratinio metro kaina, o Y ašis - namo kaina. Jei suskaičiuosime visus duomenų taškus, gausime sklaidos diagramą, kurią galima pavaizduoti linija, kaip parodyta aukščiau esančiame paveikslėlyje, ir jei įvesime keletą duomenų, tai prognozuos tam tikrą rezultatą. Idealiu atveju turime rasti liniją, kuri kirs maksimalius duomenų taškus.

Čia bandome sukurti eilutę, kuri vadinama:

Y = mX + c

Šis tiesinio ryšio tarp taikinio (priklausomo kintamojo) ir numatančiojo kintamojo (nepriklausomo kintamojo) prognozavimo metodas vadinamas linijine regresija. Tai leidžia mums ištirti ir apibendrinti dviejų kintamųjų ryšį.

  • X = nepriklausomas kintamasis
  • Y = priklausomas kintamasis
  • c = y-perėmimas
  • m = linijos nuolydis

Jei atsižvelgsime į lygtį, turime X reikšmes, kurios yra nepriklausomas kintamasis, todėl viskas, ką turime padaryti, yra apskaičiuoti m ir c reikšmes, kad galėtume numatyti Y vertę.

Taigi, kaip rasti šiuos kintamuosius?

Norėdami rasti šiuos kintamuosius, galime išbandyti daugybę verčių ir pabandyti išsiaiškinti liniją, kertančią maksimalų duomenų taškų skaičių. Bet kaip mes galime rasti tinkamiausią liniją?

Taigi, norėdami rasti geriausiai tinkančią liniją, galime naudoti mažiausiai kvadratų paklaidos funkciją, kuri ras klaidą tarp tikrosios y vertės ir numatomos vertės y`.

Mažiausių kvadratų klaidos funkciją galima pateikti naudojant šią lygtį:

Naudodamiesi šia funkcija galime sužinoti kiekvieno numatomo duomenų taško paklaidą, lygindami ją su faktine duomenų taško verte. Tada imsite visų šių klaidų sumą ir jas kvadratuosite, kad sužinotumėte prognozės nuokrypį.

kas yra pojo klasė java

Jei prie savo grafiko pridėsime trečią ašį, kurioje yra visos įmanomos klaidų vertės, ir pavaizduosime ją trimatėje erdvėje, tai atrodys taip:

Aukščiau pateiktame paveikslėlyje idealios vertės būtų apatinėje juodojoje dalyje, kuri numatys kainas, artimas tikram duomenų taškui. Kitas žingsnis - surasti geriausias įmanomas m ir c reikšmes. Tai galima padaryti naudojant optimizavimo techniką, vadinamą gradiento nusileidimu.

Gradiento nusileidimas yra iteracinis metodas, kai pradedame inicijuoti tam tikrus mūsų kintamųjų verčių rinkinius ir lėtai juos tobuliname, sumažindami klaidą tarp faktinės vertės ir numatomos vertės.

Jei manome, kad buto kainos praktiškai nepriklauso tik nuo kainos už kvadratines pėdas, yra daugybė veiksnių, tokių kaip miegamųjų, vonios kambarių ir tt skaičius. Jei atsižvelgsime ir į šias savybes, lygtis atrodys kažkas kaip šitas

Y = b0 + b1x1 + b2x2 + & hellip .. + bnxn + c

Tai yra daugialypė regresija, priklausanti tiesinei algebrai, čia galime naudoti mxn dydžio matricas, kur m yra ypatybės, o n yra duomenų taškai.

Panagrinėkime kitą situaciją, kai galime panaudoti tikimybę surasti namo būklę, norėdami klasifikuoti namą pagal tai, ar jis yra geros, ar blogos būklės. Norėdami tai padaryti, turėsime naudoti techniką, vadinamą logistine regresija, kuri veikia tikimybę, kurią reiškia sigmoidinė funkcija.

Šiame straipsnyje mes apžvelgėme mašininio mokymosi prielaidas ir tai, kaip jos taikomos mokantis mašinoje. Taigi iš esmės jis susideda iš statistikos, skaičiavimo, tiesinės algebros ir tikimybių teorijos. Skaičiavimas turi optimizavimui naudojamus metodus, tiesinė algebra turi algoritmus, kurie gali dirbti su didžiuliais duomenų rinkiniais, tikimybe galime numatyti įvykių tikimybę, o statistika padeda mums padaryti naudingų įžvalgų iš duomenų rinkinių imties.

Dabar, kai žinote mašininio mokymosi prielaidas, esu tikra, kad norite sužinoti daugiau. Čia yra keli tinklaraščiai, kurie padės jums pradėti naudotis „Data Science“:

Jei norite užsiregistruoti į visą dirbtinio intelekto ir mašininio mokymosi kursą, „Edureka“ turi specialiai kuruotą tai leis jums išmanyti tokias technikas kaip prižiūrimas mokymasis, neprižiūrimas mokymasis ir natūralios kalbos apdorojimas. Tai apima mokymus apie naujausius dirbtinio intelekto ir mašininio mokymosi pasiekimus ir techninius metodus, tokius kaip gilus mokymasis, grafiniai modeliai ir mokymasis sustiprinti.