Nuspėjamas analizės procesas verslo analitikoje su R



Tinklaraštyje pateikiama trumpa idėja apie nuspėjamą „Analytics“ procesą „Business Analytics with R“

Tipiškas modeliavimo procesas:

Tipiniame modeliavimo procese svarbu pradėti kelti hipotezę. Gaunamas RFP (užklausa dėl pasiūlymo), tada nupiešiama hipotezė.





saugojimo klasė c ++
  1. Nustatykite tinkamą duomenų šaltinį - Čia klientas gali nurodyti duomenų šaltinį, jei ne, turime ieškoti duomenų šaltinio. Atsižvelgiant į scenarijų, kai bandome įvertinti, kas laimės rinkimus, vieša duomenų analizė atliekama naudojant šaltinius, kurie apima socialinę žiniasklaidą, naujienų kanalus ar visuomenės nuomonę. Taip pat turime suprasti, kiek duomenų reikia analizuoti problemą. Šiuo atveju mes paprastai ieškome didelių pavyzdžių, nes tai yra rinkimų byla. Kita vertus, jei analizė atliekama sveikatos priežiūros srityje, tai sunku atlikti dideliam gyventojų skaičiui, nes yra galimybė gauti nepakankamą žmonių skaičių hipotezei patvirtinti. Be to, labai svarbu duomenų kokybė.
  2. Išskleisti duomenis - Pavyzdžiui, jei imsime gyventojų imtį, galime pradėti tyrinėti tokius požymius kaip didelės pajamos, mažos pajamos, amžius, dirbantys gyventojai (ne vietoje / vietoje), rezidentai, NRI, ligoninių aprėptis ir kt. . Čia hipotezei gali prireikti ne tiek daug atributų. Mes suprantame, kad atributai, tokie kaip didelės ir mažos pajamos, negali būti veiksniai, lemiantys, kas laimės rinkimus. Tačiau amžius gali pakeisti, nes jis tiesiogiai apskaičiuos, kiek žmonių ketina balsuoti. Daug kartų galime išskirti mažiau naudojamus atributus arba įtraukti atributus, kurie yra naudingi. Abiem atvejais tai gali suklysti. Tai yra priežastis, kodėl analizė yra iššūkis.
  3. Masažuokite duomenis, kad tilptų į įrankį - Taip yra todėl, kad ne visi įrankiai gali priimti visus duomenis. Tam tikri įrankiai priima tik CSV duomenis arba „Excel“ duomenis. Priemonių trūkumas yra iššūkis.
  4. Paleiskite analizę - Šią operaciją galima atlikti naudojant daugelį analizės metodų.
  5. Daryti išvadas - Analizė pateikia tikslius skaičius. Bet vartotojas turi padaryti išvadas iš šių skaičių. Pavyzdžiui, jei jame parašyta 10% ar 20%, turime suprasti, ką tai reiškia? Ar iš jo gaunama koreliacija tarp A ir B požymių?
  6. Įgyvendinti rezultatus - Norint pamatyti rezultatus versle, svarbu įgyvendinti išvadas. Pavyzdžiui, galima daryti išvadą, kad „Žmonės perka skėtį lietingu sezonu“ dėl to gali atsirasti daugiau verslo. Čia turime įgyvendinti išvadą, kai skėtį gaminame parduotuvėse, tačiau tada gali kilti valdymo problemų. Tuo metu, kai statistika duoda rezultatų, įgyvendinimas gali būti neteisingas.
  7. Stebėkite pažangą - Paskutinis žingsnis - stebėjimas vaidina svarbų vaidmenį. Stebėjimas gali būti neteisingas, nes nedaugelis organizacijų nenori stebėti pažangos, ir tai laikoma nereikšmingu žingsniu. Tačiau stebėjimas yra svarbus, nes galime suprasti, ar mūsų tyrimai ir išvados eina teisinga linkme.

Taip pat peržiūrėkite šį straipsnį' Koreliacija nereiškia priežastingumo 'kuris suteikia supratimą, kaip analitikai gali suklysti. Svarbus dalykas, kurį reikia atkreipti į šią diagramą, yra tai, kad analizės vykdymas yra vienintelis žingsnis, kai mašina yra atskaitinga, ir ne tik nuo jos priklauso žmogus, kuris galiausiai nustatys, kaip atliekami tyrimai.

Turite mums klausimą? Paminėkite juos komentarų skiltyje ir mes susisieksime su jumis.



faktorius naudojant rekursiją c

Susijusios žinutės: