SQL duomenų mokslui: vieno langelio sprendimas pradedantiesiems



Šis tinklaraščio įrašas, skirtas „SQL for Data Science“, padės suprasti, kaip SQL gali būti naudojama duomenims saugoti, pasiekti ir gauti, kad būtų galima atlikti duomenų analizę.

Kadangi „Data Science“ buvo užimta 1 vietoje, nes tai yra perspektyviausias eros darbas, mes visi bandome prisijungti . Šis tinklaraščio įrašas, skirtas „SQL for Data Science“, padės suprasti, kaip SQL gali būti naudojama duomenims saugoti, pasiekti ir gauti, kad būtų galima atlikti duomenų analizę.

Čia pateikiamos temos, kurios bus aprašyta šiame tinklaraštyje:





    1. Kodėl duomenų mokslui reikia SQL?
    2. Kas yra SQL?
    3. SQL pagrindai
    4. „MySQL“ diegimas
    5. Rankos

Kodėl duomenų mokslui reikia SQL?

Ar žinojote, kad kiekvieną dieną generuojame daugiau nei 2,5 kvintilijono baitų duomenų? Toks duomenų generavimo tempas yra priežastis, kodėl populiarėja tokios aukštos klasės technologijos kaip Duomenų mokslas , , ir taip toliau.

Iš duomenų naudingos įžvalgos yra vadinamos duomenų mokslu. Duomenų mokslas apima daugybės duomenų išskyrimą, apdorojimą ir analizavimą. Šiuo metu mums reikia kuriuos galima naudoti norint išsaugoti ir valdyti šį didžiulį duomenų kiekį.



Kas yra duomenų mokslas - „Edureka“

Tai kur Įeina SQL.

SQL gali būti naudojamas saugoti, pasiekti ir išgauti didžiulius duomenų kiekius, kad sklandžiau būtų vykdomas visas „Data Science“ procesas.



Kas yra SQL?

SQL kuri reiškia Struktūrizuota užklausų kalba - tai užklausų kalba, skirta valdyti Reliacines duomenų bazes.

Bet kas iš tikrųjų yra santykių duomenų bazė?

Reliacinė duomenų bazė yra gerai apibrėžtų lentelių grupė, iš kurios galima pasiekti, redaguoti, atnaujinti ir pan. Duomenis, nekeičiant duomenų bazės lentelių. SQL yra reliacinių duomenų bazių standartas (API).

Grįžtant prie SQL, SQL programavimas gali būti naudojamas atliekant kelis veiksmus su duomenimis, pvz., Užklausų teikimas, įterpimas, atnaujinimas, duomenų bazės įrašų ištrynimas. Reliacinių duomenų bazių, naudojančių SQL, pavyzdžiai yra „MySQL Database“, „Oracle“ ir kt.

Norėdami sužinoti daugiau apie SQL, galite pereiti šie tinklaraščiai:

  1. Suprasti SQL duomenų tipus - viskas, ką reikia žinoti apie SQL duomenų tipus
  2. CREATE TABLE in SQL - viskas, ką reikia žinoti apie lentelių kūrimą SQL

Prieš pradėdami demonstracinę versiją SQL, susipažinkime su pagrindinėmis SQL komandomis.

SQL pagrindai

SQL pateikia paprastų komandų rinkinį duomenų lentelėms modifikuoti. Peržvelkime keletą pagrindinių SQL komandų:

  • Sukurti duomenų bazę - sukuria naują duomenų bazę
  • SUKURTI LENTEL - - sukuria naują lentelę
  • ĮTERPTI Į - įterpia naujus duomenis į duomenų bazę
  • PASIRINKTI - ištraukia duomenis iš duomenų bazės
  • ATNAUJINTI - atnaujina duomenis duomenų bazėje
  • IŠTRINTI - ištrina duomenis iš duomenų bazės
  • KITA DUOMENŲ BAZĖ - modifikuoja duomenų bazę
  • KEITIMO LENTELĖ - modifikuoja lentelę
  • LAŠINĖ LENTELĖ - ištrina lentelę
  • SUKURTI INDEKSĄ - sukuria indeksą elemento paieškai
  • LAŠYTI INDEKSĄ - ištrina rodyklė

Norėdami geriau suprasti SQL, įdiekime „MySQL“ ir pažiūrėkime, kaip galite žaisti su duomenimis.

„MySQL“ diegimas

„MySQL“ įdiegimas yra paprasta užduotis. Štai a žingsnis po žingsnio vadovas tai padės jums įdiegti „MySQL“ į savo sistemą.

Baigę diegti „MySQL“, vadovaukitės žemiau esančiu skyriumi, kad gautumėte paprastą demonstracinę versiją, kuri parodys, kaip galite įterpti, manipuliuoti ir modifikuoti duomenis.

SQL duomenų mokslui - „MySQL“ demonstracinė versija

Šioje demonstracijoje pamatysime, kaip sukurti ir apdoroti duomenų bazes. Tai yra pradedančiųjų lygio demonstracija, skirta pradėti naudoti duomenų analizę SQL.

Taigi pradėkime!

1 veiksmas: sukurkite SQL duomenų bazę

SQL duomenų bazė yra saugyklos sandėlis, kuriame duomenys gali būti saugomi struktūriniu formatu. Dabar sukurkime duomenų bazę naudodami „MySQL“ :

Sukurti duomenų bazę edureka NAUDOTI edureka

Pirmiau pateiktame kode yra dvi SQL komandos:

Pastaba : SQL komandos apibrėžiamos didžiosiomis raidėmis, o SQL komandai nutraukti naudojamas kabliataškis.

  1. Sukurti duomenų bazę: ši komanda sukuria duomenų bazę, vadinamą „edureka“

    adapterio klasė java su pavyzdžiu
  2. NAUDOTI: Ši komanda naudojama duomenų bazei suaktyvinti. Čia mes aktyvuojame „edureka“ duomenų bazę.

2 žingsnis: sukurkite lentelę su reikalingomis duomenų funkcijomis

Lentelės kūrimas yra toks pat paprastas, kaip ir duomenų bazės sukūrimas. Jums tereikia apibrėžti kintamuosius ar lentelės ypatybes su atitinkamais duomenų tipais. Pažiūrėkime, kaip tai galima padaryti:

KURTI STALO žaislus (TID INTEGER NOT NULL PRIMARY KEY AUTO_INCREMENT, Item_name TEXT, Price INTEGER, Kiekis INTEGER)

Pirmiau pateiktame kodo fragmente yra šie dalykai:

  1. Norėdami sukurti lentelę, vadinamą žaislais, naudokite komandą „CREATE TABLE“.
  2. Žaislų lentelėje yra 4 ypatybės, būtent TID (operacijos ID), prekės_pavadinimas, kaina ir kiekis.
  3. Kiekvienas kintamasis apibrėžiamas pagal atitinkamus duomenų tipus.
  4. TID kintamasis yra deklaruojamas kaip pagrindinis raktas. Pirminis raktas iš esmės žymi kintamąjį, galintį išsaugoti unikalią vertę.

Galite toliau patikrinti apibrėžtos lentelės informaciją naudodami šią komandą:

„DESCRIBE“ žaislai

3 veiksmas: įterpkite duomenis į lentelę

Dabar, sukūrę lentelę, užpildykime ją kai kuriomis vertybėmis. Anksčiau šiame tinklaraštyje minėjau, kaip galite pridėti duomenis į lentelę tiesiog naudodami vieną komandą, ty INSERT INTO.

Pažiūrėkime, kaip tai daroma:

INSERT INTO žaislų VERTYBĖS (NULL, „Traukinys“, 550, 88) INSERT INTO žaislų VERTYBĖS (NULL, „Hotwheels_car“, 350, 80) NULL, „Dog_house“, 120, 54) ĮDĖKITE Į žaislų VERTYBES (NULL, „Riedlentė“, 700, 42) ĮDĖKITE Į žaislų VERTYBES (NULL, „GI Joe“, 300, 120)

Pirmiau pateiktame kodo fragmente mes paprasčiausiai įterpėme 6 pastebėjimus į savo 'žaislų' lentelę naudodami komandą INSERT INTO. Kiekvienam stebėjimui skliausteliuose nurodiau kiekvieno kintamojo ar ypatybės, kuri buvo apibrėžta kuriant lentelę, vertę.

TID kintamasis nustatytas į NULL, nes jis automatiškai didėja nuo 1.

Dabar parodykime visus duomenis, esančius mūsų lentelėje. Tai galima padaryti naudojant šią komandą:

PASIRINKITE * IŠ žaislų


4 žingsnis: modifikuokite duomenų įrašus

Tarkime, kad nusprendėte padidinti „G.I.“ kainą. Džo, nes tai pritraukia daug klientų. Kaip atnaujintumėte kintamojo kainą duomenų bazėje?

Tai paprasta, tiesiog naudokite šią komandą:

ATNAUJINTI žaislų komplektą Kaina = 350 KUR TID = 6

Komanda UPDATE leidžia modifikuoti visas lentelėje saugomas reikšmes / kintamuosius. SET parametras leidžia pasirinkti tam tikrą funkciją, o parametras WHERE naudojamas norint nustatyti kintamąjį / vertę, kurią norite pakeisti. Pirmiau pateiktoje komandoje atnaujinau duomenų įvedimo, kurio TID yra 6, kainą (G.I. Joe).

Dabar peržiūrėkime atnaujintą lentelę:

PASIRINKITE * IŠ žaislų

Taip pat galite pakeisti tai, ką norite rodyti, tiesiog nurodydami norimus peržiūrėti stulpelius. Pavyzdžiui, toliau pateiktoje komandoje bus rodomas tik žaislo pavadinimas ir jo atitinkama kaina:

PASIRINKITE prekės pavadinimą, kainą IŠ žaislų

5 žingsnis: Duomenų gavimas

Taigi įvedus duomenis ir juos modifikavus, pagaliau atėjo laikas išgauti ir atgauti duomenis pagal verslo reikalavimus. Čia galima gauti duomenis tolesnei duomenų analizei ir duomenų modeliavimui.

Atkreipkite dėmesį, kad tai yra paprastas pavyzdys, kaip pradėti naudoti SQL, tačiau realiuose scenarijuose duomenys yra daug sudėtingesni ir didesnio dydžio. Nepaisant to, SQL komandos išlieka tos pačios ir tai daro SQL tokią paprastą ir suprantamą. Jis gali apdoroti sudėtingus duomenų rinkinius naudodamas paprastų SQL komandų rinkinį.

Dabar paimkime duomenis su keliomis modifikacijomis. Peržiūrėkite žemiau esantį kodą ir pabandykite suprasti, ką jis daro, nežiūrėdamas į išvestį:

PASIRINKITE * IŠ žaislų LIMITO 2

Atspėjai! Joje pateikiami pirmieji du mano lentelėje pateikti stebėjimai.

Pabandykime ką nors įdomesnio.

PASIRINKITE * IŠ Žaislų UŽSAKYTI PAGAL kainą ASC

Kaip parodyta paveikslėlyje, vertės išdėstomos atsižvelgiant į kainų kintamojo didėjimo tvarką. Jei norėtumėte ieškoti trijų dažniausiai perkamų daiktų, ką darytumėte?

Iš tikrųjų tai gana paprasta!

PASIRINKITE * IŠ žaislų UŽSAKYKITE PAGAL DAUGUMĄ APRAŠYMO RIBOS

Pabandykime dar vieną.

PASIRINKITE * IŠ žaislų, KUR Kaina> 400 UŽSAKYTI PAGAL Kainą ASC


Ši užklausa išskiria išsamią informaciją apie žaislus, kurių kaina yra didesnė nei 400, ir išdėliojimą surikiuoja didėjančia kainos tvarka.

Taigi taip galite apdoroti duomenis naudodami SQL. Dabar, kai žinote SQL duomenų bazės pagrindus, esu tikras, kad norite sužinoti daugiau. Čia yra keli tinklaraščiai, kurie padės jums pradėti:

  1. Kas yra duomenų mokslas? Duomenų mokslo vadovas pradedantiesiems
  2. „MySQL“ pamoka - pradedančiųjų vadovas, kaip išmokti „MySQL“

Jei norite užsiregistruoti į visą dirbtinio intelekto ir mašininio mokymosi kursą, „Edureka“ turi specialiai kuruotą tai leis jums išmanyti tokias technikas kaip prižiūrimas mokymasis, neprižiūrimas mokymasis ir natūralios kalbos apdorojimas. Tai apima mokymus apie naujausius dirbtinio intelekto ir mašininio mokymosi pasiekimus ir techninius metodus, tokius kaip gilus mokymasis, grafiniai modeliai ir mokymasis sustiprinti.