Kodėl turėtumėte susilieti, kai jau galite prisijungti prie „Tableau“?



Duomenų maišymas „Tableau“ - metodas, naudojamas, kai keliuose duomenų šaltiniuose yra susijusių duomenų, kuriuos norite analizuoti kartu viename rodinyje.

Pasaulyje, kuris generuoja ir sunaudoja 2,5 kvintilijoną baitų per dieną, organizacijos privalo ieškoti naujų metodų, kaip transformuoti ir sujungti duomenis, kad būtų pasiektas optimalus efektyvumas. Vienas iš tokių duomenų sujungimo būdų yra Duomenų maišymas „Tableau“ .

Kadangi tai tarnauja tokiam svarbiam bet kurios organizacijos duomenų ciklo tikslui, tai sukuria labai svarbų modulį daugumoje . Šiame tinklaraštyje aptarsime šias sąvokas:



Kodėl jums reikia duomenų maišymo „Tableau“?

Tarkime, jūs esate a Kūrėjų lentelė kas turi „Salesforce“ saugomus sandorių duomenis ir „Access“ saugomus kvotos duomenis. Duomenys, kuriuos norite sujungti, saugomi skirtingose ​​duomenų bazėse, o kiekvienoje lentelėje užfiksuotų duomenų išsamumas dviejuose duomenų šaltiniuose skiriasi, todėl duomenų sujungimas yra geriausias būdas sujungti šiuos duomenis.

Duomenų derinimas yra naudingas šiomis sąlygomis:



  1. Norite sujungti duomenis iš skirtingų duomenų bazių, kurių nepalaiko kryžminių duomenų bazių sujungimai.

    Kryžminis duomenų bazių prisijungimas nepalaiko ryšių su kubeliais (pvz., „Oracle Essbase“) ar kai kuriais tik ištraukimo ryšiais (pavyzdžiui, „Google Analytics“). Tokiu atveju nustatykite atskirus duomenų, kuriuos norite analizuoti, duomenų šaltinius, tada naudokite duomenų maišymą, kad sujungtumėte duomenų šaltinius viename lape.

  2. Duomenys yra skirtingo lygio.

    Kartais vienas duomenų rinkinys fiksuoja duomenis naudodamas įvairius detalumo lygiai y., didesnis ar mažesnis detalumas nei kitas duomenų rinkinys.

    Pvz., Tarkime, kad analizuojate sandorių duomenis ir kvotos duomenis. Sandorių duomenys gali apimti visas operacijas. Tačiau kvotos duomenys gali sujungti sandorius ketvirčio lygiu. Kadangi kiekviename duomenų rinkinyje operacijų vertės fiksuojamos skirtingu išsamumo lygiu, turėtumėte naudoti duomenų maišymą, kad sujungtumėte duomenis.



    kaip išeiti iš Java programos

Kas yra duomenų maišymas „Tableau“?

Duomenų maišymas yra labai galinga 'Windows Vista' funkcija Lenta . Jis naudojamas, kai keliuose duomenų šaltiniuose yra susijusių duomenų, kuriuos norite analizuoti kartu viename rodinyje. Tai yra duomenų derinimo metodas, papildantis vieno duomenų šaltinio duomenų lentelę su kito duomenų šaltinio duomenų stulpeliais.

Paprastai naudodami prisijungimus naudojate tokio tipo duomenis derindami, tačiau yra atvejų, kai geriau naudoti duomenų maišymą, atsižvelgiant į tokius veiksnius kaip duomenų tipas ir jų detalumas.

Kuo jis skiriasi nuo duomenų sujungimo?

Duomenų maišymas imituoja tradicinį kairįjį sujungimą. Pagrindinis skirtumas tarp jų yra kada sujungimas atliekamas agregavimo atžvilgiu.

Kairysis prisijungimas

Kai naudojate kairįjį sujungimą duomenims sujungti, užklausa siunčiama į duomenų bazę, kurioje atliekamas sujungimas. Naudojant kairįjį sujungimą grąžinamos visos kairiosios lentelės eilutės ir visos dešinės lentelės eilutės, kurių kairėje lentelėje yra atitinkama eilutė. Tada prisijungimo rezultatai siunčiami atgal ir apibendrinami „Tableau“.

Pvz., Tarkime, kad turite šias lenteles. Jei bendri stulpeliai yra Vartotojo ID , kairysis sujungimas paima visus duomenis iš kairės lentelės ir visus duomenis iš dešinės lentelės, nes kiekvienoje eilutėje kairėje lentelėje yra atitinkama eilutės atitiktis.

Duomenų sujungimas - duomenų maišymas „Tableau“ - „Edureka“Duomenų maišymas

Kai duomenų sujungimui naudojate duomenų maišymą, kiekvieno duomenų šaltinio, kuris naudojamas lape, duomenų bazė išsiunčiama užklausa. Užklausų rezultatus, įskaitant suvestinius duomenis, „Tableau“ siunčia atgal ir sujungia. Rodinyje naudojamos visos pirminio duomenų šaltinio, kairiosios lentelės ir apibendrintos antrinio duomenų šaltinio, dešinės lentelės, eilutės, atsižvelgiant į susiejimo laukų aspektą.

c ++ kas yra vardų sritis

Galite pakeisti susiejimo lauką arba pridėti daugiau susiejimo laukų, kad į mišinį būtų įtrauktos skirtingos ar papildomos duomenų eilutės iš antrinio duomenų šaltinio, keičiant sukauptas vertes.

Pvz., Tarkime, kad turite šias lenteles. Jei susiejimo laukai yra Vartotojo ID abiejose lentelėse, sumaišydami duomenis, visi duomenys paimami iš kairės lentelės, o kairę lentelę papildo duomenys iš dešinės lentelės. Tokiu atveju ne visos vertės gali būti gautos lentelės dalis dėl šių priežasčių:

  • Kairiosios lentelės eilutėje dešinėje lentelėje nėra atitinkamos eilutės atitikties, kaip rodo nulinė vertė.
  • Dešinėje lentelėje yra kelios atitinkamos vertės, pažymėtos žvaigždute (*).

Tarkime, kad turite tas pačias lenteles kaip ir anksčiau, tačiau antriniame duomenų šaltinyje yra naujas laukas, vadinamas Tikslai . Vėlgi, jei susiejimo laukas yra Vartotojo ID , sumaišydami duomenis, visi duomenys paimami iš kairės lentelės ir papildomi duomenimis iš dešinės lentelės. Tokiu atveju ankstesniame pavyzdyje matote tą pačią nulinę vertę ir žvaigždutes be šių:

  • Nes Tikslai laukas yra matas, matote eilutės reikšmesTikslaisuvestinis laukas prieš dešinėje lentelėje esančius duomenis sujungiant su kairiosios lentelės duomenimis.
  • Kaip ir ankstesniame pavyzdyje, kairiosios lentelės eilutėje nėra atitinkamos eilutės Tikslai lauką, kaip rodo antroji nulinė vertė.

Kada pakeisti prisijungimą Maišymas

1. Duomenis reikia išvalyti.

Jei po sujungimo jūsų lentelės tinkamai nesutampa, nustatykite kiekvienos lentelės duomenų šaltinius, atlikite reikiamus tinkinimus (tai yra, pervardykite stulpelius, pakeiskite stulpelių duomenų tipus, sukurkite grupes, naudokite skaičiavimus ir kt.) Ir tada naudokite duomenų maišymą, kad sujungtumėte duomenis.

2. Prisijungimas sukelia pasikartojančius duomenis.

Duomenų pasikartojimas po sujungimo yra skirtingų detalių duomenų simptomas. Jei pastebite pasikartojančius duomenis, užuot sukūrę sujungimą, naudokite duomenų maišymą, kad susilietumėte su bendru aspektu.

3. Turite daug duomenų.

Paprastai sujungimai rekomenduojami norint sujungti duomenis iš tos pačios duomenų bazės. Prisijungimus tvarko duomenų bazė, kuri leidžia prisijungimams panaudoti kai kurias pirmines duomenų bazės galimybes. Tačiau, jei dirbate su dideliais duomenų rinkiniais, prisijungimai gali apkrauti duomenų bazę ir žymiai paveikti našumą. Tokiu atveju gali padėti duomenų maišymas. Kadangi „Tableau“ tvarko duomenų sujungimą susumavus duomenis, yra mažiau duomenų, kuriuos reikia sujungti. Kai yra mažiau duomenų, kuriuos reikia sujungti, našumas gerėja.

Duomenų maišymas „Tableau“

Duomenų maišymą galite naudoti, kai turite duomenų atskiruose duomenų šaltiniuose, kuriuos norite analizuoti kartu viename lape. „Tableau“ turi du įvardintus duomenų šaltinius Pavyzdys-superstore ir Kavos grandinėlės pavyzdys.mdb kurie bus naudojami iliustruojant duomenų maišymą.

1 veiksmas: prisijunkite prie savo duomenų ir nustatykite duomenų šaltinius

  • Prisijunkite prie duomenų rinkinio ir nustatykite duomenų šaltinį duomenų šaltinio puslapyje. Ir ašnbuilt duomenų šaltinis Kavos grandinėlės pavyzdys.mdb ,kuris yra „MS Access“ duomenų bazės failas, bus naudojamas duomenų susiliejimui iliustruoti.
  • Eiti į Duomenys > Naujas duomenų šaltinis, prijunkite prie antrojo duomenų rinkinio.Šiame pavyzdyje naudojamas Pavyzdys - „Superstore“ duomenų šaltinis. Tvišta nustatė duomenų šaltinį.
  • Spustelėkite lapo skirtuką, kad pradėtumėte kurti savo rodinį.

2 žingsnis: paskirkite pirminį duomenų šaltinį

  • Nuvilkite bent vieną lauką iš savo pirminio duomenų šaltinio į rodinį, kad jį nurodytumėte kaip pagrindinį duomenų šaltinį. Viduje Duomenys srityje spustelėkite duomenų šaltinį, kurį norite pažymėti kaip pagrindinį duomenų šaltinį. Šiame pavyzdyje Kavos grandinėlės pavyzdys yra pasirinktas.
  • Šioje ekrano kopijoje rodomos skirtingos lentelės ir sujungimai, galimi faile.

3 žingsnis: paskirkite antrinį duomenų šaltinį

klasės kelio nustatymas java
  • Duomenų šaltinių, kurie nėra pagrindinis duomenų šaltinis ar aktyvios nuorodos, rodinyje naudojami laukai automatiškai paskiria tolesnius duomenų šaltinius kaip antrinį duomenų šaltinį. Šiuo atveju „Superstore“ pavyzdys.

4 žingsnis: Sumaišykite duomenis

  • Dabar galite integruoti abiejų šaltinių duomenis remdamiesi bendru aspektu ( Valstija , tokiu atveju). Atminkite, kad šalia aspekto - būsena rodomas nedidelis nuorodos vaizdas. Tai rodo bendrą dviejų duomenų šaltinių aspektą.
  • Tarkime, kad jūs sukūrėte juostinę diagramą Pelno santykis Kolonų lentynoje ir Valstija eilių lentynoje diagramoje parodyta, kaip skiriasi pelno santykis kiekvienoje valstybėje tiek prekybos centrų, tiek kavos tinklų parduotuvėse.

Duomenų maišymo lentelėje apribojimai

  1. Yra keletas duomenų sumaišymo apribojimų, susijusių su nepridedamais agregatais, pvz Vidurinis ir RAWSQLAGG .
  2. Duomenų maišymas pažeidžia užklausos greitį labai detaliai.
  3. Kai bandote rūšiuoti pagal apskaičiuotą lauką, kuriame naudojami sumaišyti duomenys, apskaičiuotas laukas nėra pateiktas dialogo lango Rūšiuoti išskleidžiamajame lauke Laukas.
  4. „Cube“ duomenų šaltiniai gali būti naudojami tik kaip pagrindinis duomenų šaltinis derinant duomenis „Tableau“. Jų negalima naudoti kaip antrinių duomenų šaltinių.

Tikiuosi, kad dabar visi turite teisingą idėją Duomenų maišymas „Tableau“ iš šio tinklaraščio. Alkanas daugiau žinių? Nesijaudinkite, šis vaizdo įrašas padės geriau suprasti koncepciją.