logo

Nenadzorovano strojno učenje

V prejšnji temi smo se naučili nadzorovanega strojnega učenja, pri katerem se modeli usposabljajo z uporabo označenih podatkov pod nadzorom podatkov o usposabljanju. Lahko pa je veliko primerov, ko nimamo označenih podatkov in moramo najti skrite vzorce v danem naboru podatkov. Za reševanje tovrstnih primerov v strojnem učenju potrebujemo tehnike nenadzorovanega učenja.

Kaj je nenadzorovano učenje?

Kot že ime pove, je nenadzorovano učenje tehnika strojnega učenja, pri kateri modeli niso nadzorovani z naborom podatkov za usposabljanje. Namesto tega modeli sami najdejo skrite vzorce in vpoglede iz danih podatkov. Lahko ga primerjamo z učenjem, ki poteka v človeških možganih med učenjem novih stvari. Opredelimo ga lahko kot:

python rstrip
Nenadzorovano učenje je vrsta strojnega učenja, pri katerem se modeli usposabljajo z uporabo neoznačenega nabora podatkov in jim je dovoljeno, da delujejo na teh podatkih brez kakršnega koli nadzora.

Nenadzorovanega učenja ni mogoče neposredno uporabiti za problem regresije ali klasifikacije, ker za razliko od nadzorovanega učenja imamo vhodne podatke, nimamo pa ustreznih izhodnih podatkov. Cilj nenadzorovanega učenja je poiščite osnovno strukturo nabora podatkov, združite te podatke glede na podobnosti in predstavite ta nabor podatkov v stisnjenem formatu .

primer: Recimo, da algoritem za nenadzorovano učenje dobi vhodni nabor podatkov, ki vsebuje slike različnih vrst mačk in psov. Algoritem se nikoli ne uri na danem naboru podatkov, kar pomeni, da nima pojma o značilnostih nabora podatkov. Naloga algoritma za nenadzorovano učenje je, da samostojno prepozna značilnosti slike. Nenadzorovan učni algoritem bo opravil to nalogo tako, da bo nabor slikovnih podatkov združil v skupine glede na podobnosti med slikami.

Nadzorovano strojno učenje

Zakaj uporabljati nenadzorovano učenje?

Spodaj je nekaj glavnih razlogov, ki opisujejo pomen nenadzorovanega učenja:

  • Učenje brez nadzora je koristno za iskanje koristnih vpogledov iz podatkov.
  • Nenadzorovano učenje je zelo podobno, saj se človek uči razmišljati na podlagi lastnih izkušenj, zaradi česar je bližje pravi AI.
  • Nenadzorovano učenje deluje na neoznačenih in nekategoriziranih podatkih, zaradi česar je nenadzorovano učenje pomembnejše.
  • V resničnem svetu nimamo vedno vhodnih podatkov z ustreznim izhodom, zato za reševanje takih primerov potrebujemo nenadzorovano učenje.

Delo nenadzorovanega učenja

Delovanje nenadzorovanega učenja je mogoče razumeti s spodnjim diagramom:

Nadzorovano strojno učenje

Tukaj smo vzeli neoznačene vhodne podatke, kar pomeni, da niso kategorizirani in tudi ustrezni izhodi niso podani. Zdaj se ti neoznačeni vhodni podatki vnesejo v model strojnega učenja, da ga usposobi. Najprej bo interpretiral neobdelane podatke, da bi našel skrite vzorce iz podatkov, nato pa bo uporabil ustrezne algoritme, kot je združevanje k-sredstev v gruče, drevo odločitev itd.

Ko uporabi ustrezen algoritem, ta razdeli podatkovne objekte v skupine glede na podobnosti in razlike med objekti.

Vrste algoritmov nenadzorovanega učenja:

Algoritem nenadzorovanega učenja je mogoče nadalje kategorizirati v dve vrsti težav:

Nadzorovano strojno učenje
    Grozdenje: Grozdenje je metoda združevanja objektov v gruče, tako da objekti z največ podobnosti ostanejo v skupini in imajo manj ali nič podobnosti s predmeti druge skupine. Analiza grozdov najde skupne značilnosti med podatkovnimi objekti in jih kategorizira glede na prisotnost in odsotnost teh skupnih značilnosti.Združenje: Asociacijsko pravilo je nenadzorovana učna metoda, ki se uporablja za iskanje odnosov med spremenljivkami v veliki bazi podatkov. Določa nabor elementov, ki se pojavljajo skupaj v naboru podatkov. Pravilo povezovanja naredi marketinško strategijo učinkovitejšo. Na primer ljudje, ki kupijo artikel X (recimo kruh), prav tako ponavadi kupijo artikel Y (maslo/marmelada). Tipičen primer asociacijskega pravila je analiza tržne košarice.

Opomba: teh algoritmov se bomo naučili v naslednjih poglavjih.

Algoritmi nenadzorovanega učenja:

Spodaj je seznam nekaterih priljubljenih algoritmov za nenadzorovano učenje:

ankita dave
    K-pomeni grozdenje KNN (k-najbližji sosedje) Hierarhično združevanje Odkrivanje anomalij Nevronske mreže Analiza glavnih komponent Neodvisna analiza komponent Apriorni algoritem Razčlenitev singularne vrednosti

Prednosti nenadzorovanega učenja

  • Nenadzorovano učenje se uporablja za zahtevnejše naloge v primerjavi z nadzorovanim učenjem, ker pri nenadzorovanem učenju nimamo označenih vhodnih podatkov.
  • Zaželeno je nenadzorovano učenje, saj je enostavno dobiti neoznačene podatke v primerjavi z označenimi podatki.

Slabosti nenadzorovanega učenja

  • Nenadzorovano učenje je samo po sebi težje kot nadzorovano učenje, saj nima ustreznega rezultata.
  • Rezultat algoritma nenadzorovanega učenja je lahko manj natančen, ker vhodni podatki niso označeni, algoritmi pa ne poznajo natančnega rezultata vnaprej.