V tem članku se bomo naučili, kako uporabiti funkcijo lm() za prilagajanje linearnih modelov v programskem jeziku R.
Linearni model se uporablja za napovedovanje vrednosti neznane spremenljivke na podlagi neodvisnih spremenljivk. Večinoma se uporablja za ugotavljanje povezave med spremenljivkami in napovedovanjem. Funkcija lm() se uporablja za prilagajanje linearnih modelov podatkovnim okvirjem v jeziku R. Uporablja se lahko za izvajanje regresije, analize posameznega stratuma variance in analize kovariance za napovedovanje vrednosti, ki ustreza podatkom, ki niso v podatkovnem okviru. Ti so v veliko pomoč pri napovedovanju cen nepremičnin, vremenskih napovedih itd.
Če želite prilagoditi linearni model v jeziku R z uporabo lm() Funkcijo data.frame() najprej uporabimo za ustvarjanje vzorčnega podatkovnega okvira, ki vsebuje vrednosti, ki jih je treba prilagoditi linearnemu modelu z uporabo regresijske funkcije. Nato uporabimo funkcijo lm(), da določeno funkcijo prilagodimo danemu podatkovnemu okviru.
Sintaksa:
lm (prilagajanje_formule, podatkovni okvir)
Parameter:
fitting_formula: določa formulo za linearni model. podatkovni okvir: določa ime podatkovnega okvira, ki vsebuje podatke.
Nato lahko uporabimo funkcijo summary() za ogled povzetka linearnega modela. Funkcija summary() interpretira najpomembnejše statistične vrednosti za analizo linearnega modela.
masonova formula
Sintaksa:
povzetek (linearni_model)
Povzetek vsebuje naslednje ključne informacije:
- Preostala standardna napaka: določa standardni odklon napake, kjer kvadratni koren variance odšteje n minus 1 + # vpletenih spremenljivk namesto deljenja z n-1. Večkratni R-kvadrat: določa, kako dobro se vaš model ujema s podatki. Prilagojeni R-kvadrat: normalizira večkratni R-kvadrat tako, da upošteva, koliko vzorcev imate in koliko spremenljivk uporabljate. F-statistika: je globalni test, ki preverja, ali je vsaj eden od vaših koeficientov različen od nič.
primer: Primer za prikaz uporabe funkcije lm().
R
# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # view summary of linear model> summary>(linear_model)> |
>
>
Izhod:
Pokliči:
lm(formula = y ~ x^2, podatki = df)
Ostanki:
1 2 3 4 5
2.000e+00 5.329e-15 -3.000e+00 -2.000e+00 3.000e+00
Koeficienti:
Ocena Std. Vrednost t napake Pr(>|t|)
(Prestrezanje) -7,0000 3,0876 -2,267 0,10821
x 6,0000 0,9309 6,445 0,00757 **
—
Signif. kode: 0 ‘***’ 0,001 ‘**’ 0,01 ‘*’ 0,05 ‘.’ 0,1 ‘’ 1
Preostala standardna napaka: 2,944 pri 3 prostostnih stopnjah
Večkratni R-kvadrat: 0,9326, prilagojeni R-kvadrat: 0,9102
F-statistika: 41,54 na 1 in 3 DF, p-vrednost: 0,007575
Diagnostične ploskve
Diagnostične ploskve nam pomagajo videti razmerje med različnimi statističnimi vrednostmi modela. Pomaga nam pri analizi obsega odstopanj in učinkovitosti vgrajenega modela. Za ogled diagnostičnih risb linearnega modela uporabljamo funkcijo plot() v jeziku R.
Sintaksa:
plot (linearni_model)
primer: Diagnostične ploskve za zgoraj vgrajeni linearni model.
R
# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # view diagnostic plot> plot>(linear_model)> |
>
>
Izhod:

Risanje linearnega modela
Z uporabo metode abline() lahko narišemo zgornji prilagojeni linearni model, da ga dobro vizualiziramo. Najprej narišemo razpršeni graf podatkovnih točk in ga nato prekrijemo z abline grafom linearnega modela s funkcijo abline().
Sintaksa:
plot (df$x, df$y)
25 c do kabline (linearni_model)
primer: Risanje linearnega modela
R
niz v int
# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # Plot abline plot> plot>( df$x, df$y )> abline>( linear_model)> |
>
>
Izhod:

Napovedujte vrednosti za neznane podatkovne točke z uporabo prilagojenega modela
Za predvidevanje vrednosti za nove vnose z uporabo zgoraj prilagojenega linearnega modela uporabljamo funkcijo predict(). Funkcija predict() vzame model in podatkovni okvir z neznanimi podatkovnimi točkami ter napove vrednost za vsako podatkovno točko glede na prilagojeni model.
Sintaksa:
napoved (model, podatki)
Parameter:
model: določa linearni model. podatki: določa podatkovni okvir z neznanimi podatkovnimi točkami.
primer: Napovedovanje novih vložkov
R
# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # Predict values> predict>( linear_model, newdata =>data.frame>(x=>c>(15,16,17)) )> |
>
>
Izhod:
1 2 3 83 89 95>