logo

Kako najti standardno odstopanje v R?

V tem članku bomo razpravljali o tem, kako najti standardno odstopanje Programski jezik R . Standardni odklon R je merilo razpršitve vrednosti. Lahko se definira tudi kot kvadratni koren variance.

Formula standardnega odklona vzorca:



s = sqrt{frac{1}{N-1}displaystylesumlimits_{i=1}^N(x_i-overline{x})^2 }

kje,

  • s = standardni odklon vzorca
  • N = število entitet
  • overline{x}= povprečje entitet

V bistvu obstajata dva različna načina za izračun standardne deviacije v programskem jeziku R, oba sta obravnavana spodaj.



okno.odpri javascript

Metoda 1: Naivni pristop

Pri tej metodi izračuna standardnega odklona bomo uporabili zgornjo standardno formulo vzorčnega standardnega odklona v jeziku R.

Primer 1:

R

v <->c>(12,24,74,32,14,29,84,56,67,41)> s<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s)>
>
>

Izhod:



[1]   25.53886>

Primer 2:

R

v <->c>(1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s)>
>
>

Izhod:

[1] 2.676004>

2. način: Uporaba sd()

Funkcija sd() se uporablja za vrnitev standardnega odklona.

Sintaksa: sd(x, na.rm = FALSE)

Parametri:

    x: numerični vektor, matrika ali podatkovni okvir.na.rm: odstraniti manjkajoče vrednosti?

Vrnitev: Vzorčni standardni odklon x.

Primer 1:

R

v <->c>(12,24,74,32,14,29,84,56,67,41)> s<->sd>(v)> print>(s)>
>
>

Izhod:

[1] 25.53886>

Primer 2:

R

v <->c>(71,48,98,65,45,27,39,61,50,24,17)> s1<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s1)> s2<->sd>(v)> print>(s2)>
>
>

Izhod:

[1] 23.52175>

Primer 3:

R

v <->c>(1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s1<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s1)> s2<->sd>(v)> print>(s2)>
>
>

Izhod:

[1] 2.676004>

Izračunajte standardni odklon podatkovnega okvira:

Standardni odklon podatkovnega okvira lahko izračunamo z obema metodama. lahko vzamemo nabor podatkov šarenice in za vsak stolpec izračunamo standardni odklon.

Primer 1:

R

data>(iris)> sd>(iris$Sepal.Length)> sd>(iris$Sepal.Width)> sd>(iris$Petal.Length)> sd>(iris$Petal.Width)>
>
>

Izhod:

opombe pod črto
[1] 0.8280661 [1] 0.4358663 [1] 1.765298 [1] 0.7622377>

Standardno odstopanje lahko izračunamo tudi za celoten podatkovni okvir skupaj s pomočjo funkcije apply.

R

# Load the iris dataset> data>(iris)> # Calculate the standard deviation for each column> std_deviation <->apply>(iris[, 1:4], 2, sd)> # Display the standard deviation values> print>(std_deviation)>
>
>

Izhod:

Sepal.Length Sepal.Width Petal.Length Petal.Width 0.8280661 0.4358663 1.7652982 0.7622377>

Stolpci od 1 do 4 nabora podatkov šarenice, ki so številčni stolpci s spremenljivimi meritvami, so izbrani z uporabo izraza šarenica[, 1:4] v zgornji kodi.

Funkcija sd se uporabi za vsak stolpec (označen z 2) izbrane podnabora nabora podatkov šarenice z uporabo funkcije za uporabo. Dobljene vrednosti standardnega odklona se shranijo v vektor std_deviation za vsak stolpec.