V prejšnji temi smo se naučili nadzorovanega strojnega učenja, pri katerem se modeli usposabljajo z uporabo označenih podatkov pod nadzorom podatkov o usposabljanju. Lahko pa je veliko primerov, ko nimamo označenih podatkov in moramo najti skrite vzorce v danem naboru podatkov. Za reševanje tovrstnih primerov v strojnem učenju potrebujemo tehnike nenadzorovanega učenja.
Kaj je nenadzorovano učenje?
Kot že ime pove, je nenadzorovano učenje tehnika strojnega učenja, pri kateri modeli niso nadzorovani z naborom podatkov za usposabljanje. Namesto tega modeli sami najdejo skrite vzorce in vpoglede iz danih podatkov. Lahko ga primerjamo z učenjem, ki poteka v človeških možganih med učenjem novih stvari. Opredelimo ga lahko kot:
python rstrip
Nenadzorovano učenje je vrsta strojnega učenja, pri katerem se modeli usposabljajo z uporabo neoznačenega nabora podatkov in jim je dovoljeno, da delujejo na teh podatkih brez kakršnega koli nadzora.
Nenadzorovanega učenja ni mogoče neposredno uporabiti za problem regresije ali klasifikacije, ker za razliko od nadzorovanega učenja imamo vhodne podatke, nimamo pa ustreznih izhodnih podatkov. Cilj nenadzorovanega učenja je poiščite osnovno strukturo nabora podatkov, združite te podatke glede na podobnosti in predstavite ta nabor podatkov v stisnjenem formatu .
primer: Recimo, da algoritem za nenadzorovano učenje dobi vhodni nabor podatkov, ki vsebuje slike različnih vrst mačk in psov. Algoritem se nikoli ne uri na danem naboru podatkov, kar pomeni, da nima pojma o značilnostih nabora podatkov. Naloga algoritma za nenadzorovano učenje je, da samostojno prepozna značilnosti slike. Nenadzorovan učni algoritem bo opravil to nalogo tako, da bo nabor slikovnih podatkov združil v skupine glede na podobnosti med slikami.
Zakaj uporabljati nenadzorovano učenje?
Spodaj je nekaj glavnih razlogov, ki opisujejo pomen nenadzorovanega učenja:
- Učenje brez nadzora je koristno za iskanje koristnih vpogledov iz podatkov.
- Nenadzorovano učenje je zelo podobno, saj se človek uči razmišljati na podlagi lastnih izkušenj, zaradi česar je bližje pravi AI.
- Nenadzorovano učenje deluje na neoznačenih in nekategoriziranih podatkih, zaradi česar je nenadzorovano učenje pomembnejše.
- V resničnem svetu nimamo vedno vhodnih podatkov z ustreznim izhodom, zato za reševanje takih primerov potrebujemo nenadzorovano učenje.
Delo nenadzorovanega učenja
Delovanje nenadzorovanega učenja je mogoče razumeti s spodnjim diagramom:
Tukaj smo vzeli neoznačene vhodne podatke, kar pomeni, da niso kategorizirani in tudi ustrezni izhodi niso podani. Zdaj se ti neoznačeni vhodni podatki vnesejo v model strojnega učenja, da ga usposobi. Najprej bo interpretiral neobdelane podatke, da bi našel skrite vzorce iz podatkov, nato pa bo uporabil ustrezne algoritme, kot je združevanje k-sredstev v gruče, drevo odločitev itd.
Ko uporabi ustrezen algoritem, ta razdeli podatkovne objekte v skupine glede na podobnosti in razlike med objekti.
Vrste algoritmov nenadzorovanega učenja:
Algoritem nenadzorovanega učenja je mogoče nadalje kategorizirati v dve vrsti težav:
Opomba: teh algoritmov se bomo naučili v naslednjih poglavjih.
Algoritmi nenadzorovanega učenja:
Spodaj je seznam nekaterih priljubljenih algoritmov za nenadzorovano učenje:
ankita dave
Prednosti nenadzorovanega učenja
- Nenadzorovano učenje se uporablja za zahtevnejše naloge v primerjavi z nadzorovanim učenjem, ker pri nenadzorovanem učenju nimamo označenih vhodnih podatkov.
- Zaželeno je nenadzorovano učenje, saj je enostavno dobiti neoznačene podatke v primerjavi z označenimi podatki.
Slabosti nenadzorovanega učenja
- Nenadzorovano učenje je samo po sebi težje kot nadzorovano učenje, saj nima ustreznega rezultata.
- Rezultat algoritma nenadzorovanega učenja je lahko manj natančen, ker vhodni podatki niso označeni, algoritmi pa ne poznajo natančnega rezultata vnaprej.