Hiperparametri v strojnem učenju so tisti parametri, ki jih izrecno določi uporabnik za nadzor učnega procesa. Ti hiperparametri se uporabljajo za izboljšanje učenja modela, njihove vrednosti pa so nastavljene pred začetkom procesa učenja modela.
V tej temi bomo razpravljali o enem najpomembnejših konceptov strojnega učenja, tj. o hiperparametrih, njihovih primerih, prilagajanju hiperparametrov, kategorijah hiperparametrov, kako se hiperparameter razlikuje od parametra v strojnem učenju? Toda preden začnemo, najprej razumejmo hiperparameter.
Kaj so hiperparametri?
Pri strojnem/globokem učenju model predstavljajo njegovi parametri. Nasprotno pa proces usposabljanja vključuje izbiro najboljših/optimalnih hiperparametrov, ki jih učni algoritmi uporabljajo za zagotavljanje najboljšega rezultata. Torej, kaj so ti hiperparametri? Odgovor je, ' Hiperparametri so definirani kot parametri, ki jih izrecno določi uporabnik za nadzor učnega procesa.'
Tukaj predpona 'hiper' nakazuje, da so parametri parametri najvišje ravni, ki se uporabljajo pri nadzoru učnega procesa. Vrednost hiperparametra izbere in nastavi inženir strojnega učenja, preden učni algoritem začne učiti model. Zato so ti zunanji modelu in njihovih vrednosti med procesom usposabljanja ni mogoče spreminjati .
distribucijski zakon Boolov algebra
Nekaj primerov hiperparametrov v strojnem učenju
- K v algoritmu kNN ali K-najbližjega soseda
- Stopnja učenja za usposabljanje nevronske mreže
- Delitveno razmerje vlak-test
- Velikost serije
- Število epoh
- Veje v drevesu odločanja
- Število gruč v algoritmu združevanja v gruče
Razlika med parametrom in hiperparametrom?
Vedno obstaja velika zmeda med parametri in hiperparametri ali hiperparametri modela. Torej, da bi odpravili to zmedo, razumejmo razliko med obema in kako sta med seboj povezana.
Parametri modela:
Parametri modela so konfiguracijske spremenljivke, ki so notranje za model in model se jih nauči sam. Na primer , W Uteži ali koeficienti neodvisnih spremenljivk v modelu linearne regresije . oz Uteži ali koeficienti neodvisnih spremenljivk v SVM, uteži in pristranskosti nevronske mreže, centroid grozda v grozdenju. Nekatere ključne točke za parametre modela so naslednje:
- Model jih uporablja za napovedovanje.
- Model se jih nauči iz samih podatkov
- Te običajno niso nastavljene ročno.
- To so del modela in ključ do algoritma strojnega učenja.
Hiperparametri modela:
Hiperparametri so tisti parametri, ki jih uporabnik eksplicitno določi za nadzor učnega procesa. Nekatere ključne točke za parametre modela so naslednje:
- Običajno jih ročno določi inženir strojnega učenja.
- Za dano težavo ni mogoče vedeti natančne najboljše vrednosti hiperparametrov. Najboljšo vrednost je mogoče določiti bodisi s splošnim pravilom bodisi s poskusi in napakami.
- Nekaj primerov hiperparametrov je hitrost učenja za usposabljanje nevronske mreže, K v algoritmu KNN,
Kategorije hiperparametrov
Na splošno lahko hiperparametre razdelimo v dve kategoriji, ki sta navedeni spodaj:
Hiperparameter za optimizacijo
Postopek izbire najboljših hiperparametrov za uporabo je znan kot uravnavanje hiperparametrov, postopek uglaševanja pa je znan tudi kot optimizacija hiperparametrov. Optimizacijski parametri se uporabljajo za optimizacijo modela.
Nekaj priljubljenih optimizacijskih parametrov je navedenih spodaj:
Opomba: Hitrost učenja je ključni hiperparameter za optimizacijo modela, tako da, če obstaja zahteva po nastavitvi samo enega hiperparametra, se priporoča prilagoditev stopnje učenja.
Hiperparameter za posebne modele
Hiperparametri, ki so vključeni v strukturo modela, so znani kot hiperparametri za specifične modele. Ti so navedeni spodaj:
Pomembno je določiti hiperparameter števila skritih enot za nevronsko mrežo. Mora biti med velikostjo vhodne plasti in velikostjo izhodne plasti. Natančneje, število skritih enot mora biti 2/3 velikosti vhodne plasti plus velikost izhodne plasti.
Pri kompleksnih funkcijah je treba določiti število skritih enot, vendar ne sme pretiravati z modelom.
Zaključek
Hiperparametri so parametri, ki so izrecno definirani za nadzor učnega procesa pred uporabo algoritma strojnega učenja za nabor podatkov. Ti se uporabljajo za določitev učne zmogljivosti in kompleksnosti modela. Nekateri hiperparametri se uporabljajo za optimizacijo modelov, kot je velikost serije, stopnja učenja itd., nekateri pa so specifični za modele, kot je število skritih slojev itd.