OLTP ir OLAP



Šiame tinklaraštyje trumpai pasakojama apie OLTP ir OLAP bei įvairius naudojimo atvejus.

OLTP ir OLAP

Teigiama, kad OLTP yra labiau internetinė sandorių sistema arba duomenų saugojimo sistema, kai vartotojas daugybę internetinių operacijų atlieka naudodamasis duomenų saugykla. Taip pat sakoma, kad realiu laiku vyksta daugiau ad-hoc skaitymų / rašymų.





OLAP yra daugiau duomenų neprisijungus saugykla. Prie jo prieinamakartų skaičiusneprisijungus. Pvz., Masiniai žurnalo failai yra nuskaitomi ir tada įrašomi atgal į duomenų failus. Kai kurios įprastos vietos, kuriose naudojamas OLAP, yra žurnalo darbai, duomenų gavybos darbai ir kt.

Teigiama, kad „Cassandra“ yra daugiau OLTP, nes tai realiuoju laiku, o „Hadoop“ yra labiau „OLAP“, nes ji naudojama analizei ir masiniams rašymams.



Kodėl reikia integruoti OLAP ir OLTP?

Jei ieškote pigiausios viešbučių užsakymo kainos per kitas 365 dienas, čia turite didžiulį „Cassandra“ duomenų rinkinį ir norite gauti rekomendacijų dėl realaus laiko duomenų bazės, reklama vykdoma pagal kainą.

Esant tokiam scenarijui, turime kartoti visus įrašus ir išlaikyti jo analizę, o tai yra didžiulis darbas neprisijungus, kurį reikia pradėti dažnai. Čia „Hadoop“ pradeda veikti kaip masiniai duomenys.

Kita nauda yra ta, kad mes galime paleisti vieną grupę ir nutraukti skirtingo „Hadoop“ grupės paleidimą.



Trečia nauda yra ta, kad taip pat galima sumažinti daug eksploatacijos išlaidų.

kas yra gamykla angularjs

Atsižvelgiant į scenarijų, kuriame, jei vartotojas gerai išmano įvairias „Hadoop“ ekologines sistemas, tokias kaip „Hive“, „Pig Latin“ ir turi į juos integruoti duomenis, tada reikia įjungti kai kuriuos duomenų šaltinius „Cassandra“ ir bandyti paleisti žemėlapį Sumažinkite ir darbo vietų skaičių.

Tarp OLTP ir OLAP yra pastebimas modelis. OLTP yra mažiau rašymų, pvz. Informacija apie viešbutį. Darant prielaidą, kad kaina keičiasi kas 5000 kartų per sekundę, skaitinių čia gali būti daugiau. Tokiame scenarijuje gali būti 1 įrašas per sekundę, bet perskaityta gali būti šimtai ir tūkstančiai. Taigi santykis čia yra maždaug 1: 1000.

Įdomus pastebėjimas, kad „Cassandra“ gali lengvai tilpti į šį modelį, į kurį įeina modeliai, kuriuose skaitymo / rašymo yra lygu. Be to, kalbant apie OLTP, net jei pateksite į derinamą ir tvirtą nuoseklumo modelį, galite pamatyti milisekundžių skirtumą tarp galimų nuoseklių modelių ir stipriausių nuoseklių modelių. Taigi „Cassandra“ gali tilpti į OLTP.

Priėjus prie OLAP, galima pamatyti skirtingus OLAP modelius, o tai reiškia, kad vienu metu vyksta keli rašymai. „OLAP“ mes išleidžiame duomenis vienu kadru, t. Y. Visi žurnalo failai dedami į duomenų saugyklą ir tada mes pradedame apdoroti. Duomenų modelis arba prieigos modelis yra visiškai priešingas OLTP tipo programai. Čia bus naudinga „Hadoop“ arba „MapReduce“.

Turite mums klausimą? Paminėkite juos komentarų skiltyje ir mes susisieksime su jumis.

Susijusios žinutės:

5 populiariausios priežastys mokytis Kasandros