4 praktinės priežastys išmokti „Hadoop 2.0“



Šios 4 priežastys, kodėl reikia pereiti prie „Hadoop 2.0“, kalba apie „Hadoop“ darbo rinką ir apie tai, kaip ji gali padėti paspartinti jūsų karjerą, suteikdama jums galimybę naudotis didžiulėmis darbo galimybėmis.

Kai buvau jaunesnė, mėgau „Žvaigždžių karų“ filmų serijas. Aš taip pamilau, kad turėjau šią vaizdo kasetę su kiekviena iš jų. Aš juos žiūrėdavau vėl ir vėl. Tada atėjo DVD grotuvų laikas, ir aš turėjau vėl gauti šiuos filmus į DVD. Neturėjau jokių abejonių vėl nusipirkti visą rinkinį DVD, nes norėjau išbandyti naują technologiją ir toliau mėgautis mėgstamais filmais. Viskas buvo puiku, kol atsirado dar viena nauja technologija - „Blu-ray“. Jau du kartus nusipirkusi filmus nekantravau jų vėl pirkti. Kurį laiką nesistengiau „atnaujinti“ savęs, manydama, kad be šios technologijos man viskas gerai. Ir man viskas gerai. Šiaip tai neturėjo įtakos mano gyvenimui. Bet mačiau tendencijos pasikeitimą ir negalėjau dalytis savo filmais su draugais, kaip jie darė tarpusavyje. Tikrai jaučiausi palikta.





Pagaliau išėjau ir pasiėmiau filmą į „Blu-ray“. Aš tai prisimenu ne todėl, kad myliu filmą, bet dėl ​​to, kad vaizdo įrašo kokybė buvo mintyse. Be to, aš gavau visą filmų rinkinį viename „Blu-ray“ diske.

Poreikis ar noras nuolat atsinaujinti yra labiausiai susijęs su mūsų profesija, nes rizika yra didesnė. Tapo labai svarbu išlaikyti savo žaidimą.



4 praktinės „Hadoop 2.0“ mokymosi priežastys:

Kad ir kaip būtų neišvengiama, nuolat atnaujinti savo profesiją tapo svarbia mūsų gyvenimo dalimi. Kad ir kaip bauginančiai tai skambėtų, nereikia sunerimti, nes technologijos iš tikrųjų taip greitai ar smarkiai nesikeičia. Tačiau pokalbiai ir informacija apie šias technologijas ir dalykus, kuriuos galime su jomis padaryti, tampa vis matomesni. Štai keletas priežasčių, kodėl turėtumėte būti nuolat atnaujinami:

# 1: Nesusigaudyk

Priežastys mokytis „Hadoop 2.0“



Neatkreipus dėmesio į naujausią technologijos atnaujinimą, galite atrodyti kaip elnias, įkliuvęs į žibintą. Ne visai spinduliuojantis jūsų profesinių galimybių vaizdas. Jei būsite naujausia, bendraamžiai jus gerbs dėl jūsų profesinių įgūdžių. Gali būti, kad nereikia įdiegti kiekvieno naujo dalyko, kurį išmokote, tačiau būtina žinoti apie atnaujinimus.

Pvz., Kai kalbama apie „Hadoop“, galite pranešti savo bendraamžiams, kad „Hadoop 2.5.0“ turi autentifikavimo patobulinimų, kai naudojate HTTP tarpinį serverį. Taip pat toje pačioje „Hadoop“ versijoje yra nuostata rašyti tiesiai į „Graphite“.

Organizacijoms galvojant apie perėjimą prie „Hadoop“, būtina būti naujausiais atnaujinimais. O „žinojimas“ gali labai pakeisti jūsų karjerą.

# 2: turėdamas konkurencinį kraštą

Gerbiami savo srityje kvalifikuoti profesionalai. Geriausias būdas būti geriausiu atveju - būti naujausiam. Jūsų poreikis nuolat atsinaujinti atspindi jūsų aistrą darbui. Plėtodami savo darbo ir pramonės patirtį, jūs pelnysite aplinkinių žmonių pasitikėjimą ir pagarbą. Žvelgiant iš lyderystės perspektyvos, tai yra neįkainojama!

Net jei jūsų organizacija vis dar dirba su „Hadoop 1.0“, žinodamas visas naujausias „Hadoop 2“ funkcijas, jūs išlaikysite kelią, nes jis yra palyginti naujas ir tikrai geresnis. Tai sužinoję pirmieji įgytumėte pranašumą prieš savo bendraamžius.

# 3: naujos galimybės

Liūdna realybė, kad dabartinis mūsų vaidmuo nuolat keičiasi. Su laiku ateina papildoma atsakomybė ir galimybės atlikti naujas užduotis. Sekdami naujausią informaciją apie pramonės tendencijas galite geriausiai pasinaudoti šiomis galimybėmis.

Tokios kompanijos kaip „Macy's“, „Lockheed Martin“, „California Creative Solutions“, „Capital One“, „CSpring“, „CACI International Inc.“, „Oracle“, „Yahoo!“, „American Express“, „BlueHawk“, „Aetna“, „Lawrence Livermore“ nacionalinė laboratorija ir daugelis kitų, ieško žmonių, įgudusių naudotis naujausiomis „Hadoop 2“, kaip ir „YARN“.

# 4: priimti geresnius sprendimus

Papildoma informacija leis jums pasirinkti pagrįstus sprendimus ir priimti geresnius sprendimus. Tai padės jums atpažinti galimybes ir suteikti papildomos vertės jūsų organizacijos strategijai.

„Hadoop 2“ turi savybių, kurios padidina greitį ir sumažina išlaidas. Siūlomi variantai, kaip pagerinti našumą ir padidinti greitį, tikrai gali padidinti organizacijos produktyvumą. Štai keletas „Hadoop 2“ funkcijų, kurios bus naudingos organizacijai, ir jų siūlymas padidins jūsų karjerą.

  • „Hadoop“ paleidimo „Microsoft Windows“ palaikymas

  • Supaprastintas „MapReduce“ dvejetainių failų paskirstymas per HDFS YARN paskirstytojoje talpykloje.

  • Patobulintas naujų programų naudojimas YARN naudojant „Application History Server“ ir „Application Timeline Server“

  • Užbaigti HTTPS palaikymą HDFS

  • „Kerberos“ integracija „YARN“ laiko juostos parduotuvėje.

  • Heterogeninės HDFS saugyklos hierarchijos palaikymas.

  • HDFS duomenų atminties talpykla su centralizuotu administravimu ir valdymu.

  • Supaprastintas „MapReduce“ dvejetainių failų paskirstymas per HDFS YARN paskirstytojoje talpykloje.

Yra ne tik praktinės priežastys, kodėl reikia nuolat atnaujinti. Yra ir techninių priežasčių. „Hadoop“ turi daugybę funkcijų, kurios yra naudingos organizacijoms. Nuodugniai pažvelgus į juos, susidarysite aiškų vaizdą apie tai, kas yra naudinga.

Koks yra naujausias „Hadoop“ atnaujinimas?

Kiekvienas produktas išgyvena įvairius išleidimo etapus ir pateikia įvairias savo versijas. „Hadoop“ nėra išimtis ir sugalvojo „Hadoop 2.0“. „Apache“ fondas pateikė vėlesnes „Hadoop“ versijas, pvz., „Hadoop 2.1.0“, „Hadoop 2.4.0“, ir pasiekė „Hadoop 2.5.1“, kuri yra naujausia versija, išleista 2014 m. Rugsėjo mėn.

Kodėl „Hadoop 2“ buvo išleistas?

Su nauja versija pateikiamos papildomos funkcijos ir ištaisytos klaidos. Taigi kiekvieną kartą, kai naudojate tam tikrą „Hadoop“ versiją ir manote, kad galima pridėti tam tikrą funkciją arba reikia ištaisyti kai kurias klaidas, praneškite apie tai „Apache“ fondo vaikinams. Šie vaikinai savo ruožtu dirba su ja ir suteikia jums geresnį produktą kitoje versijoje.

„Hadoop 2“ - ne tik skaičius

„Hadoop 2“ nėra tik naujausia „Hadoop“ versija. Apskritai tai yra antros kartos architektūra. Arun Murthy, „Hadoop“ platintojo „Hortonworks“ įkūrėjas ir architektas, tvirtina, kad skirtumas yra svarbus, nes pertvarkymo, reikalingo norint „Hadoop“ perkelti ne tik iš paketinio apdorojimo, bet ir į realiojo laiko analizės pasaulį, reikia labai daug.

Aptarkime, kuo „Hadoop 2.0“ skiriasi nuo pirmtako „Hadoop 1.0“. Akivaizdu, kad vėliau išleista versija bus pranašesnė už ankstesnę versiją. Toliau pateikiami keturi pagrindiniai „Hadoop 2.0“ patobulinimai, palyginti su „Hadoop 1.x“:

  • HDFS federacija - „NameNode“ horizontalusis mastelis

  • „NameNode“ didelis prieinamumas - „NameNode“ nebėra vienas gedimo taškas

  • Verpalai - galimybė apdoroti terabaitų ir petabaitų duomenis, pasiekiamus HDFS, naudojant „Non-MapReduce“ programas, tokias kaip MPI, GIRAPH

  • Išteklių tvarkytuvė - suskirsto dvi pagrindines perkrauto „JobTracker“ funkcijas (išteklių valdymą ir darbų planavimą / stebėjimą) į du atskirus demonus: visuotinį išteklių valdytoją ir kiekvienai programai skirtą „ApplicationMaster“.

Yra papildomų funkcijų, tokių kaip „Capacity Scheduler“ („Hadoop“ įgalinti daugiabučių palaikymą), „Data Snapshot“, „Windows“ palaikymas, NFS prieiga, leidžianti išplėsti „Hadoop“ pritaikymą pramonėje, kad būtų išspręstos „Big Data“ problemos.

modelio vaizdo valdiklis java

„Hadoop 2.X“ prieš „Hadoop 1.X“

Padarykime nedidelį palyginimą ir pažiūrėkime, kokiais būdais „Hadoop 2.0“ yra geresnis ir skiriasi nuo „Hadoop 1.0“

Kodėl pirmenybė teikiama „Hadoop 2“, o ne „Hadoop 1.0“?

„Hadoop 2.0“ siūlo našumo patobulinimus, kurie naudingi susijusioms Hadoop ekosistemos technologijoms. Be novatoriškų HDFS ir antrosios kartos architektūros (YARN) funkcijų, yra dar daugiau ir didesnių priežasčių, kodėl pirmenybę teikiama „Hadoop 2“, o ne „Hadoop 1.0“:

  • „Hadoop 2“ nebeturi kalbos apribojimų. Reiškia, dabar „Hadoop“ gali naudoti daugybė specialistų.

  • Naudojant „Hadoop 2“, įveikiamos kliūtys, tokios kaip „MapReduce“ koduotojų trūkumas.

  • 2 kartus greičiau nei „Hadoop 1.0“

  • 2 kartus didesnė už IG su esama aparatine įranga.

  • Naudojant YARN, programų ir programavimo sąsaja yra daug atviresnė ir lankstesnė.

  • „Hadoop 2“ praplečia „Hadoop“ naudojimo „Big Data“ projektuose galimybes.

  • Naudodamiesi „Hadoop 2“, kūrėjai dabar gali atlikti daugybę įvairių duomenų apdorojimo užduočių, viršijančių ankstesnę „Hadoop“ paketinio apdorojimo sritį.

  • Siūlo naujas galimybes informacijos valdytojams ir pašalina ankstesnių versijų trūkumus.

  • Šis naujas leidimas turi unikalią funkciją, kad tame pačiame „Hadoop“ klase galima vykdyti kelis darbo krūvius.

  • „Hadoop“ nebėra tik viena funkcija. Dabar jo taikymas apima ne tik HDFS ir „MapReduce“.

Pagrindiniai verpalų pranašumai

Mes žinome, kad YARN yra antros kartos architektūra, pažiūrėkime, kuo ji yra tokia puiki.

  • Skalė

  • Nauji programavimo modeliai ir paslaugos

  • Patobulintas grupių naudojimas

  • Vikrumas

  • Daug daugiau nei „Java“

  • Ir daug daugiau

„Hadoop 2“ įgūdžių paklausa

Organizacijos dabar pradeda ar eksperimentuoja su „Hadoop 2“. Todėl reikia „Hadoop 2“ kvalifikuotų specialistų. Daugelis organizacijų jau pradėjo ieškoti žmonių, kurie galėtų dirbti su „Hadoop“. Yra aiškių požymių, kad YARN auga ir galiausiai pakeis MapReduce įgūdžių poreikį.

Štai keletas nuomonių apie dabartinę ir numatomą „Hadoop“ įgūdžių paklausą:

  • Pasak „Gartner“ analitikų, „Hadoop 2“ yra gyvybiškai svarbi plėtra, nes didžiosios įmonės visame pasaulyje nustatė, kad „Hadoop“ yra žaidimų keitiklis valdant „Big Data“.

  • Pasak Erico Kavanagho iš „Bloor“ grupės, „Hadoop 2.0“ įgavo potraukį tarp informacijos darbuotojų, norinčių sugluminti „Big Data“.

  • „Hadoop 2.0“ diegimas ir toliau auga, o dabar jis eina į brandos stadiją.

  • Organizacijos žino apie YARN pranašumus ir džiaugiasi tuo.

Čia pateikiama „Hadoop 2.0 / YARN“ darbo vietų apžvalga Iš tiesų.com

Kas persikelia į „Hadoop 2“ ar jau turi?

„Yahoo“:

„Yahoo! , visų dalykų lyderis, Hadoopas įdiegė YARN (0,23x). Pasak Murthy, „Yahoo“ 35 000 mazgų klasteris dabar apdoroja 130–150 darbų per dieną, palyginti su 50–60 darbo vietų prieš YARN.

Kalbėdamas apie žvaigždžių pasirodymą, Murthy cituoja: „Kai turite 2x daugiau nei 35 000–40 000 mazgų, tai yra fenomenalu“. Jis taip pat pridūrė: „Tai yra gana patraukli istorija pasakyti CIO, kad jei tik atnaujinsite programinę įrangą iš„ Hadoop 1 “į„ Hadoop 2 “, savo darbuose pastebėsite 2 kartus didesnį pralaidumą.“

„eBay“:

„eBay“ turi vieną didžiausių „Hadoop“ klasterių pramonėje, kur duomenys pateikiami petabaitais. Jie taip pat perkėlė savo grupes į „Hadoop 2“.

Išvada:

Kadangi „Hadoop 2“ yra subrendęs ir lengviau įgyvendinamas, jie netgi įtikina skeptikus ir vis daugiau organizacijų pereina į „Hadoop 2.0“. Yra pagrįstų priežasčių vengti „1.x“ versijų. Tačiau naudojant „Hadoop 2“ net netikintys žmonės svarsto, nes jis gali būti naudojamas įvairiems tikslams. Išmokę „Hadoop 2.0“ ir ją įdiegę, norėdami atlikti „Big Data“ skaičiavimus, atidarysite vartus į techniškai pažengusią ir finansiškai naudingą karjerą.

Turite mums klausimą? Prašau paminėti juos komentarų skiltyje ir mes su jumis susisieksime.

Susijusios žinutės:

Kiek būtina „Hadoop“ treniruotė?