„Fuzzy K“ reiškia grupavimą Mahoute



Šiame tinklaraštyje pateikiama „Apache Mahout“ grupių „Fuzzy K-Means“ įvadas.

„Fuzzy K-Means“ yra lygiai tas pats algoritmas kaip ir „K“ reiškia, kuris yra populiari paprasta klasterizavimo technika. Vienintelis skirtumas yra tas, kad vietoj taško priskyrimo tik vienam klasteriui, jis gali turėti tam tikrą neryškumą arba sutapti tarp dviejų ar daugiau grupių. Toliau pateikiami pagrindiniai dalykai, apibūdinantys „Fuzzy K-Means“:





  • Skirtingai nuo „K-Means“, kuris siekia kieto klasterio, kuriame kiekvienas taškas priklauso vienam klasteriui, „Fuzzy K-Means“ siekia, kad minkštesni klasteriai sutaptų.
  • Vienas taškas minkštame klasteryje gali priklausyti daugiau nei vienam klasteriui, turintis tam tikrą afiniteto vertę kiekvieno taško atžvilgiu.
  • Afinitas yra proporcingas to taško atstumui nuo klasterio centroido.
  • Panašiai kaip „K-Means“, „Fuzzy K-Means“ veikia objektus, kurių atstumo matas yra apibrėžtas ir kurie gali būti vaizduojami n- matmenų vektorinė erdvė.

„Fuzzy K-Means Map“ Sumažinkite srautą

Nėra didelio skirtumo tarp „MapReduce“ srauto „K-Means“ ir „Fuzzy K-Means“. Abiejų „Mahout“ įgyvendinimas yra panašus.

kas yra metodas, slepiantis java

Toliau pateikiami esminiai parametrai „Fuzzy K-Means“ įgyvendinimui:



  • Jums reikia įvesties „Vector“ duomenų rinkinio.
  • Turi būti „RandomSeedGenerator“, kad būtų galima sėti pradines k grupes.
  • Norint įvertinti atstumą, reikia SquaredEuclideanDistanceMeasure.
  • Didelė konvergencijos ribos vertė, pvz., –Cd 1.0, jei buvo naudojama atstumo mato vertė kvadratu
  • Numatytoji „maxIterations“ vertė yra -x 10.
  • Normalizacijos koeficientas arba neryškumo koeficientas, kurio vertė didesnė nei -m 1,0

Turite mums klausimą? Paminėkite juos komentarų skiltyje ir mes susisieksime su jumis.

charato naudojimas java

Susijusios žinutės



java liejimas dvigubai int

Prižiūrimas mokymasis Apache Mahout