Verslo analizės modeliavimo būdai su R.



Tinklaraštyje trumpai supažindinama su verslo analizės modeliavimo metodika su R.

Skirtingi modeliavimo būdai:

Bet kokią problemą galime suskirstyti į mažesnius procesus:





klasifikacija - yra, kur mes klasifikuojame duomenis. Pvz. ligos visos ligos pasireiškia tam tikru elgesiu, ir mes galime jas toliau klasifikuoti.

ką daro init python

Pavyzdžiui: imunitetą mažinančios ligos, galvos skausmą sukeliančios ligos ir kt.



Regresija - apima ryšį tarp kelių kintamųjų.

Pavyzdžiui: kaip žmogaus svoris yra susijęs su jo ūgiu.

AnomolisAptikimas - iš esmės yra svyravimas.



Pavyzdžiui: aukštos arba žemos įtampos atveju.

Kitas pavyzdys galėtų būti reguliuojamas elgesys, kuris apima vairavimą dešinėje arba kairėje pusėje, atsižvelgiant į šalį. Čia anomolis yra kažkas, važiuojantis iš priešingos pusės.

Kitas pavyzdys gali būti tinklo įsibrovimas. Čia autentifikuotas vartotojas prisijungia prie jūsų įmonės svetainės, o jei prisijungia kas nors neautentifikuotas, tai yraAn0moly.

Atributų svarba - Tai iš esmės suteikia kelis požymius, tokius kaip ūgis, svoris, temperatūra, širdies plakimas. Pažymėtina, kad visi šie atributai yra svarbūs užduočiai atlikti.

kas yra daugybinis paveldėjimas java

Pvz .: Kažkas bando nuspėti, kada žmogus pasieks tarnybą. Kiekvienas atributas vaidina svarbų vaidmenį, tačiau ne visi atributai yra svarbūs.

Asociacijos taisyklės - Paprasčiau tariant, tai yra analizuoti ar numatyti kitą elgesį, kai jis sukasi aplink rekomendacijų variklį.

Pavyzdžiui: duoną perkantis asmuo taip pat gali nusipirkti pieno. Jei analizuosime ankstesnę elgseną apsipirkdami, visos krepšelio prekės turi ryšį. Tokiu atveju gali būti tikimybė, kad duoną perkantis asmuo pirks ir pieną.

Grupavimas - Tai viena seniausių statistikos metodų. Tiesą sakant, visada galima modeliuoti bet kokią problemą, ar tai būtų klasifikacija, ar grupavimas, o tai reiškia panašių subjektų grupavimą.

Pavyzdžiui:

1) Paimkite obuolių ir apelsinų krepšelį, kuriame obuolius galime atskirti nuo apelsinų.

2) Svarbus grupių naudojimo atvejis yra sveikatos priežiūra. Beveik visa statistika ir analizė prasidėjo nuo sveikatos priežiūros naudojimo atvejų. Norėdami gilintis, yra susitelkęs terminas, vadinamas kohortomis (žmonės, sergantys panašiomis ligomis), kad juos būtų galima tirti atskirai nuo esamų klientų. Pavyzdžiui, jei 10 žmonių kenčia nuo karščiavimo, o dar 10 žmonių - nuo galvos skausmo, rasime tai, kas tarp jų yra bendro, ir sukursime vaistus.

Funkcijos ištraukimas - Funkcijų išskyrimo tikslumas, pagrįstumas ir gedimas yra gana aktualūs. Kitaip tariant, funkcijų išskyrimą galima pavadinti modelio atpažinimu.

Pavyzdžiui:

„Google“ paieškoje, kai vartotojas įveda terminą, jis pateikia rezultatus. Dabar reikia užduoti svarbų klausimą, iš kur ji sužinojo, kuris puslapis yra tinkamas ir netinkamas terminui? Į tai galima atsakyti išskleidžiant ypatybes ir atpažįstant modelį, kur jis prideda ryškių savybių. Tarkime, pateikiama nuotrauka, tam tikros kameros aptinka veidus, paryškina veidą, kad būtų gražūs vaizdai, o taip pat naudojamas funkcijų atpažinimas.

Prižiūrimas mokymas ir neprižiūrimas mokymas

iki) Spėjimo kategorija - Technikos apima regresiją, logistiką, neuroninius tinklus ir sprendimų medžius. Kai kurie pavyzdžiai apima sukčiavimo nustatymą (kai kompiuteris sužino ir numato kitą sukčiavimą iš ankstesnės sukčiavimo istorijos). Neprižiūrint mokymosi negalima numatyti pavyzdžiais, nes nėra istorinių duomenų.

yra git ir github tas pats

b) Klasifikavimo kategorija - Atsižvelgiant į tai, ar sandoris yra apgaulingas, ar ne, jis patenka į klasifikavimo kategoriją. Čia mes paimame istorinius duomenis ir klasifikuojame juos pagal sprendimų medžius arba, jei istorinių duomenų visiškai nepriimame, tada mes tiesiogiai pradedame nuo duomenų ir bandome savarankiškai naudoti funkcijas. Pavyzdžiui, jei turime žinoti darbuotojus, kurie greičiausiai išeis iš organizacijos arba liks. Jei tai yra nauja organizacija, kur negalime naudoti istorinių duomenų, visada galime naudoti klasterius duomenims išgauti.

c) Žvalgymo kategorija - Tai yra tiesioginis metodas, kurį reikia sugalvoti, ką reiškia didieji duomenys. Neprižiūrint mokymosi, tai vadinama principiniais komponentais ir grupavimu.

d) Bendrų interesų kategorija - čia yra keli elementai, tokie kaip kryžminis pardavimas / pardavimas, rinkos krepšelio analizė. Atliekant krepšelio analizę nėra prižiūrimo mokymosi, nes nėra istorinių duomenų. Taigi duomenis mes imame tiesiogiai ir randame asociacijas, seką ir faktorių analizę.

Turite mums klausimą? Paminėkite juos komentarų skiltyje ir mes susisieksime su jumis.

Susijusios žinutės: