Kaip „LOD Expressions“ veikia „Tableau“?



„Tableau LOD Expressions“ yra elegantiškas ir galingas būdas atsakyti į klausimus, susijusius su keliais detalumo lygiais vienoje vizualizacijoje.

Bet kurio BI įrankio tikslas yra duoti Duomenų analizė geresnis srautas. Jei sprendžiant problemą, kaip profesionalui, kyla sunkumų naudojant įrankį, srauto būsena nutrūksta. Viena iš dažniausių šios problemos priežasčių yra būtinybė dirbti su duomenimis, kurie buvo kaupiami į skirtingus Detalumo lygis Tableau (LOD) .

Tabletė, pastatyta ant krūvos viršaus šeštą kartą iš eilės, ant „Gartner's Magic Quadrant“, neabejotinai pasako ką nors apie jos paklausą rinkoje. Tai turbūt pats geriausias laikas .





Šis tinklaraštis padės suprasti LOD išraiškas ir aptarti šias temas:



Tablo LOD: Kodėl jums reikia LOD?

Dažnai kyla klausimų, su kuriais tenka susidurti analizuojant duomenis. Šiuos klausimus dažnai yra paprasta užduoti, tačiau į juos sunku atsakyti. Jie dažnai skamba taip:

Klausimai „Tableau“ - „Tableau LOD“ - „Edureka“Siekiant išspręsti tokio tipo klausimus, buvo įvesta nauja sintaksė Detalumo lygis „Tableau 9.0“. Ši nauja sintaksė supaprastino ir išplėtė „Tableau“ skaičiavimo kalbą, suteikdama galimybę tiesiogiai spręsti šiuos klausimus.

Stalviršis LOD: Kas yra LOD?

LOD išraiškos yra elegantiškas ir galingas būdas atsakyti į klausimus, susijusius su keliais detalumo lygiais vienoje vizualizacijoje.



Išsamumo lygis „Tableau“ ar „LOD“ išraiškose leidžia apskaičiuoti reikšmes duomenų šaltinio ir vizualizacijos lygiu. Tačiau LOD išraiškos suteikia jums dar daugiau galimybių kontroliuoti tikslumo lygį, kurį norite apskaičiuoti. Jie gali būti atliekami a grūdėtesnis lygis (ĮSKAIčiuokite skaičiavimą), a mažiau granuliuotas lygis (IŠSKYRUS skaičiavimą) arba visiškai nepriklausomas švelnus l (FIKSUOTAS skaičiavimas).

Stalviršis LOD: Eilučių lygio ir rodinio lygio išraiškos

Eilučių lygis

Tableau, posakių nuorodos nesusumuotas duomenų šaltinių stulpeliai apskaičiuojami kiekvienai eilutei pagrindinėje lentelėje. Šiuo atveju išraiškos matmenis yra eilutės lygis . Eilutės lygio išraiškos pavyzdys yra:

[Pardavimai] / [Pelnas]

Šis skaičiavimas bus įvertintas kiekvienoje duomenų bazės eilutėje. Kiekvienos eilutės pardavimo vertė bus padalinta iš pelno vertės toje eilutėje, sukuriant naują stulpelį su daugybos rezultatu (pelno santykis).

Jei kuriate skaičiavimą pagal šį apibrėžimą, išsaugokite jį pavadinimu [Pelno santykis], tada nuvilkite jį iš Duomenų sritis į lentyną „Tableau“ paprastai sujungia apskaičiuotą rodinio lauką:

SUM [pelno santykis]

Peržiūros lygis

Priešingai, išraiškos, nurodančios suvestinė duomenų šaltinio stulpeliai apskaičiuojami pagal matmenis, apibrėžtus matmenų matmenimis. Šiuo atveju išraiškos matmuo yra vaizdo lygis. Peržiūros lygio išraiškos pavyzdys yra:

SUM (pardavimai) / SUM (pelnas)

Jei vilksite šį skaičiavimą į lentyną (arba įvesite jį tiesiai į lentyną kaip ad hoc skaičiavimą), „Tableau“ jį pridės AGG funkcija :

AGG (SUM (pardavimai) / SUM (pelnas))

Tai yra tai, kas žinoma kaip Bendras skaičiavimas .

Stalviršis LOD: Apibendrinimas ir LOD išraiškos

LOD išraiška yra šiurkštesnė nei rodinio išsamumo lygis

Išraiškos detalumas yra šiurkštesnis nei rodinyje, kai nurodoma a matmenų pogrupis vaizde.

Pavyzdžiui, rodiniui, kuriame buvo matmenys [Kategorija] ir [Segmentas], galite sukurti „Tableau“ išsamumo lygį, kuriame naudojamas tik vienas iš šių aspektų:

{NUSTATYTA [Segmentas]: SUM ([Pardavimai])}

Šiuo atveju išraiškos detalumas yra šiurkštesnis nei rodinyje. Savo vertes ji grindžia viena dimensija ([Segmentas], o požiūris grindžia savo požiūrį dviem aspektais ([Segmentas] ir [Kategorija]).

Rezultatas yra tas, kad naudojant išsamią išraiškos lygį rodinyje tam tikros reikšmės bus pakartotos - tai yra pasirodyti kelis kartus .

LOD išraiška yra smulkesnė nei rodinio išsamumo lygis

Išraiškos detalumas yra tikslesnis nei rodinyje, kai nurodoma a matmenų viršutinis rinkinys vaizde.

Kai rodinyje naudosite tokią išraišką, „Tableau“ sujungs rezultatus iki rodinio lygio. Pavyzdžiui, šis „Tableau“ išsamumo lygis nurodo du aspektus:

{NUSTATYTA [Segmentas], [Kategorija]: SUM ([Pardavimas])}

Kai ši išraiška naudojama rodinyje, kurio išsamumo lygis yra tik [Segmentas], reikšmės turi būti apibendrinti . Štai ką pamatytumėte, jei šią išraišką nuvilktumėte į lentyną:

AVG ([{Fiksuotas [segmentas]], [Kategorija]: SUM ([Pardavimai]]}])

An agregavimas (šiuo atveju vidurkis) automatiškai priskiria Tableau. Jei reikia, galite keisti kaupimą.

LOD išraiškos pridėjimas prie rodinio

Ar rodinyje apibendrinamas ar pakartojamas rodinio „Tableau“ detalumo lygis, nustato išraiškos tipas ir detalumas .

  • ĮSKAIČIUOTI išraiškos bus su tokiu pat išsamumo lygiu kaip ir rodinys, arba smulkesnės nei rodinys. Todėl vertybės niekada nebus kartojamos.
  • FIKSUOTI posakiai gali turėti smulkesnį nei vaizdas, grubesnį ar tą patį detalumo lygį. Poreikis kaupti FIKSUOTO detalumo lygio rezultatus priklauso nuo to, kokie matmenys yra rodinyje.
  • EXCLUDE išraiškos visada parodo pakartotas reikšmes rodinyje. Kai lentynoje pateikiami skaičiavimai, įskaitant EXCLUDE išsamumo išraiškas, „Tableau“ numatytoji reikšmė yra ATTR agregavimas priešingai nei SUM ar AVG, nurodyti, kad išraiška iš tikrųjų nėra kaupiama ir kad agregacijos pakeitimas neturės jokios įtakos vaizdui.

Detalumo lygio išraiškos visada automatiškai suvyniojamos į visumą, kai jos pridedamos prie rodinio lentynos, nebent jos naudojamos kaip matmenys.

Stalviršis LOD: Filtrai ir LOD išraiškos

Vaizdas čia vaizduojafiltrų vykdymo tvarka iš viršaus į apačią.Dešinėje pusėje pateiktas tekstas parodo, kur LOD išraiškos vertinamos šia seka.

Ištraukimo filtrai (oranžine spalva) yra aktualūs tik tuo atveju, jei kuriate lentelės ištrauką iš duomenų šaltinio. Lentelių skaičiavimo filtrai (tamsiai mėlyni) taikomi atlikus skaičiavimus, todėl slepia žymes, nefiltruodami pagrindinius skaičiavimuose naudojamus duomenis.

PATIKRINTI skaičiavimai taikomi prieš aspektų filtrus, todėl, jei nepopuliarinsite filtrų lentynos laukų, kad pagerintumėte rodinio našumą naudodami kontekstinius filtrus, jie bus ignoruojami.

Stalviršis LOD: LOD posakių tipai

ĮSKAIčiuokite skaičiavimą

INCLUDE apskaičiuoja reikšmes naudodamas nurodytus matmenis, be jokių matmenų, esančių rodinyje. Šis išsamumo išraiškos lygis yra naudingiausias, kai įtraukiate aspektą, kurio nėra rodinyje.

Pavyzdžiui: {ĮSKAIČIUOTI [Kliento vardas]: SUM ([Pardavimai])}

IŠSKYRUS Skaičiavimą

EXCLUDE aiškiai pašalina matmenis iš išraiškos, tai yra, jie atima matmenis iš rodinio išsamumo lygio. Šis išsamumo lygis „Tableau“ yra naudingiausias norint pašalinti matmens matmenį.

Pavyzdžiui: {IŠSKYRUS [regionas]: SUM ([pardavimas])}

PATVIRTINTAS Skaičiavimas

FIXED apskaičiuoja reikšmes naudodamas nurodytus matmenis, nenurodydamas rodinio išsamumo lygio, tai yra, nenurodant jokių kitų rodinio matmenų. Šis išsamumo išraiškos lygis taip pat ignoruoja visus rodinio filtrus, išskyrus konteksto filtrus, duomenų šaltinių filtrus ir ištraukimo filtrus.

kaip naudoti anakondos pitoną

Pavyzdžiui: {NUSTATYTA [Regionas]: SUM ([Pardavimai])}

Stalviršis LOD: LOD išraiškų kūrimas

LOD išraiškos sintaksė

Detalumo išraiškos lygis turi tokią struktūrą:

ĮSKAIČIUOTI

1 veiksmas: nustatykite vizualizaciją

  1. Atidarykite „Tableau Desktop“ ir prijunkite prie „Superstore“ pavyzdys išsaugotas duomenų šaltinis.
  2. Eikite į naują darbalapį.
  3. Nuo Duomenys srityje, dalyje Matmenys, vilkite Regionas į Stulpeliai Lentynas.
  4. Nuo Duomenys srityje, dalyje Priemonės, vilkite Pardavimai į Eilutės Lentynas. Rodoma juostinė diagrama, rodanti kiekvieno regiono pardavimo sumą.

2 žingsnis: sukurkite LOD išraišką

Vietoj visų regiono pardavimų sumos, galbūt taip pat norite pamatyti vidutinius kiekvieno regiono kliento pardavimus. Norėdami tai padaryti, galite naudoti LOD išraišką.

  1. Pasirinkite Analizė > Sukurti apskaičiuotą lauką.
  2. Atidarytame skaičiavimo redaktoriuje atlikite šiuos veiksmus:
    • Įvardykite skaičiavimą „Pardavimas vienam klientui“.
    • Įveskite šią LOD išraišką:

      {ĮSKAIČIUOTI [Kliento vardas]: SUM ([Pardavimai])}

  3. Baigę spustelėkite Gerai. Naujai sukurta LOD išraiška pridedama prie duomenų srities dalyje Priemonės.

3 žingsnis: vizualizacijoje naudokite LOD išraišką

  1. Nuo Duomenys srityje, dalyje Priemonės, vilkite Pardavimai vienam klientui į Eilutės lentyną ir padėkite ją kairėje nuo SUM (Pardavimai).
  2. Lentelėje Eilutės dešiniuoju pelės mygtuku spustelėkite Pardavimai vienam klientui ir pasirinkite Priemonė (suma) > Vidutinis. Dabar galite pamatyti visų pardavimų sumą ir vidutinius kiekvieno kliento pardavimus kiekviename regione. Pavyzdžiui, galite pamatyti, kad Centriniame regione pardavimai apytiksliai sudarė 500 000 USD vidutinis kiekvieno kliento pardavimas yra maždaug 800 USD .

Stalviršis LOD: Duomenų šaltiniai, palaikantys LOD išraiškas

Duomenų šaltinis Palaikoma / nepalaikoma
Aktorius VectorwiseNepalaikomas.
„Amazon EMR Hadoop Hive“Palaikomas avilys nuo 0,13.
„Amazon Redshift“Palaikoma.
„Aster“ duomenų bazėPalaikoma 4.5 versija.
„Cloudera Hadoop“Palaikomas avilys nuo 0,13.
„Cloudera Impala“Palaikoma „Impala“ 1.2.2 versija.
Kubai (daugialypiai duomenų šaltiniai)Nepalaikomas.
„DataStax Enterprise“Nepalaikomas.
EXASOLPalaikoma.
Ugnies paukštisPalaikoma 2.0 versija.
Bendrasis ODBCRibotas. Priklauso nuo duomenų šaltinio.
„Google Big Query“Palaikoma standartinei SQL, o ne „Legacy“.
„IBM DB2“Palaikoma 8.1 versija.
MarkLogicPalaikoma 7.0 versija.
SAP HANAPalaikoma.
SAP „Sybase ASE“Palaikoma.
SAP „Sybase IQ“Palaikoma 15.1 versija.
„Spark SQL“Palaikoma.
IšsipūtęsNepalaikomas.
Duomenų ištraukimo lentelėPalaikoma.
TeradataPalaikoma.
VertikaPalaikoma 6.1 versija.
„Microsoft Access“Nepalaikomas.
„Microsoft Jet“ pagrįstos jungtysNepalaikomas.
Hortonworks Hadoop avilysPalaikomas avilys nuo 0,13.

1.1 versijoje HIVE LOD posakiai, kuriantys kryžminius sujungimus, nėra patikimi.

„IBM BigInsights“Palaikoma.
„Microsoft SQL Server“Palaikoma „SQL Server 2005“ ir toliau.
„MySQL“Palaikoma.
„IBM PDA“ („Netezza“)Palaikoma 7.0 versija.
„Oracle“Palaikoma 9i versija.
„Actian Matrix“ („ParAccel“)Palaikoma 3.1 versija.
Pagrindinė „Greenplum“Palaikoma 3.1 versija.
„PostgreSQL“Palaikoma 7.0 versija.
„Progress OpenEdge“Palaikoma.

Stalviršis LOD: Lentelės skaičiavimai ir LOD

LOD išraiškos nėra nauja lentelių skaičiavimų forma. Nors jie gali pakeisti daugelį lentelių skaičiavimų, jų pagrindinis tikslas yra atverti naujas galimybes.LOD išraiškos ir lentelių skaičiavimai veikia skirtingai.

Lentelės skaičiavimai LOD išraiškos
Lentelės skaičiavimus generuoja Užklausos rezultatai .LOD išraiškos generuojamos kaip užklausos į. Dalis pagrindinis duomenų šaltinis . Jie išreiškiami kaip įdėtas pasirinkimas, taigi, atsižvelgiant į DBVS našumą.
Lentelės skaičiavimai gali duoda tik lygius arba mažiau granuliuotus rezultatus nei minėta LOD.LOD gali duoti rezultatų nepriklauso nuo minėtos LOD .
Matmenys, valdantys lentelės operacijas, yra atskirti nuo skaičiavimo sintaksės.Matmenys, valdantys LOD išraiškos operacijas, yra įterptas į išraišką pats.
Lentelių skaičiavimai naudojami kaip apibendrintos priemonės .LOD išraiškos gali būti naudojamos kituose konstruktuose.
Lentelės skaičiavimų filtrai veikia kaip SLĖPTI .Filtrai ant LOD veikia kaip NEĮTRAUKTI .

Stalviršis LOD: LOD apribojimai

Toliau pateikiami apribojimai, taikomi LOD išraiškoms.

  • LOD išraiškos, kurios nurodo slankiojo kablelio matus, paprastai elgiasi nepatikimai, kai naudojamos požiūriui, kuriam reikia palyginti išraiškos reikšmes.
  • LOD nerodomas duomenų šaltinio puslapyje.
  • Nurodydami parametrą matmenų deklaracijoje, visada naudokite parametro pavadinimą, o ne parametro vertę.
  • Suderinus duomenis, susiejimo laukas iš pirminio duomenų šaltinio turi būti rodomas, kad galėtumėte naudoti išsamios informacijos išraišką iš antrinio duomenų šaltinio.

Be to, kai kurie duomenų šaltiniai turi sudėtingumo ribas. „Tableau“ neišjungs šių duomenų bazių skaičiavimų, tačiau užklausos klaidos yra galimos, jei skaičiavimai tampa pernelyg sudėtingi.