Varianca je merska vrednost, ki se uporablja za ugotavljanje, kako se podatki razpršijo glede na srednjo ali povprečno vrednost nabora podatkov. Uporablja se za ugotavljanje, kako so porazdelitveni podatki porazdeljeni glede na srednjo ali povprečno vrednost. Simbol, ki se uporablja za definiranje variance, je σ2. To je kvadrat standardne deviacije.
V statistiki se uporabljata dve vrsti variance,
- Varianca vzorca
- Variance prebivalstva
Varianca populacije se uporablja za določitev, kako vsaka podatkovna točka v določeni populaciji niha ali je razpršena, medtem ko se varianca vzorca uporablja za iskanje povprečja kvadratov odstopanj od povprečja.
V tem članku bomo spoznali Varianca (vzorec, populacija), njihove formule, lastnosti in druge podrobnosti.
Kazalo
- Kaj je varianca?
- Vrste variance
- Simbol variance
- Primer variance
- Formula variance
- Vzorčna formula variance
- Formula populacijske variance
- Formula variance za združene podatke
- Formula variance za nezdružene podatke
- Formula za izračun variance
- Kako izračunati varianco?
- Varianca in standardni odklon
- Varianca in kovarianca
- Lastnosti variance
- Primeri formule variance
- Povzetek – Varianca
- Pogosta vprašanja o Variance
Kaj je varianca?
Merimo različne vrednosti podatkov in te vrednosti se uporabljajo za različne namene. Podatki so lahko podani v dveh vrstah združenih podatkov ali nezdruženih (diskretnih) podatkov. Če so podatki podani v obliki razrednih intervalov, se imenujejo združeni podatki, če pa so podatki podani v obliki ene same podatkovne točke, se imenujejo diskretna ali nezdružena podatkovna točka. Varianca je merilo razpršenosti podatkov glede na srednjo vrednost podatkov. Pove nam, kako so podatki razpršeni v dani podatkovni vrednosti. Z lahkoto lahko izračunamo varianco vzorca in varianco populacije za združene in nezdružene podatke.
Definicija variance
Varianca je statistična mera, ki kvantificira širjenje ali disperzijo nabora podatkovnih točk. Označuje, koliko se posamezne podatkovne točke v naboru podatkov razlikujejo od srednje vrednosti (povprečja) nabora podatkov
Vrste variance
Varianco danih podatkov lahko definiramo v dveh vrstah,
- Variance prebivalstva
- Varianca vzorca
Zdaj pa se o njih podrobneje seznanimo.
Variance prebivalstva
Varianca populacije se uporablja za ugotavljanje širjenja dane populacije. Prebivalstvo je opredeljeno kot skupina ljudi in vsi ljudje v tej skupini so del populacije. Pove nam, kako se populacija skupine spreminja glede na povprečno populacijo.
Vsi člani skupine so znani kot populacija. Ko želimo ugotoviti, kako se vsaka podatkovna točka v dani populaciji spreminja ali je razpršena, uporabimo varianco populacije. Uporablja se za kvadrat razdalje vsake podatkovne točke od povprečja populacije.
Varianca vzorca
Če so podatki o populaciji zelo veliki, postane težko izračunati populacijsko varianco nabora podatkov. V tem primeru vzamemo vzorec podatkov iz danega niza podatkov in poiščemo varianco tega niza podatkov, ki se imenuje vzorčna varianca. Pri izračunu vzorčnega povprečja poskrbimo, da izračunamo vzorčno povprečje, tj. povprečje niza vzorčnih podatkov in ne povprečje populacije. Vzorčno varianco lahko definiramo kot povprečje kvadrata razlike med vzorčno podatkovno točko in vzorčno srednjo vrednostjo.
Simbol variance
Simbol za varianco je običajno predstavljen z grško črko sigma na kvadrat (σ²), ko se nanaša na varianco populacije. Varianca vzorca je pogosto označena s s².
Primer variance
Koncept variance lahko razumemo s pomočjo primera, obravnavanega spodaj.
Poiščite populacijsko varianco podatkov {4,6,8,10}
rešitev:
Srednja vrednost = (4+6+8+10)/4 = 7
4 (4-7)2 9 6 (6-7)2 1 8 (8-7)2 1 10 (10-7)2 9 Varianca = (9+1+1+9)/4 = 20/4 = 5
Tako je varianca podatkov 5
Formula variance
Varianca za niz podatkov je označena s simbolom σ2. Za podatke o prebivalstvu je njegova formula enaka vsoti kvadratov razlik vnosov podatkov od povprečja, deljeno s številom vnosov. Pri vzorčnih podatkih pa vrednost števca delimo z razliko med številom vnosov in enoto.
Vzorčna formula variance
Če je nabor podatkov vzorec, je formula variance podana z
str 2 = ∑ (x jaz – x̄) 2 /(n – 1)
kje,
- x je povprečje nabora vzorčnih podatkov
- n je skupno število opazovanj
Formula populacijske variance
Če imamo nabor podatkov o prebivalstvu, je formula zapisana kot
str 2 = ∑ (x jaz – x̄) 2 /n
kje,
- x je povprečje niza podatkov o prebivalstvu
- n je skupno število opazovanj
Izračunamo lahko tudi varianco za združene in nezdružene nize podatkov. Različne formule za varianco so,
razlika med programom in skriptom
Formula variance za združene podatke
Za združene podatke je formula variance obravnavana spodaj,
Vzorčna formula variance za združene podatke (σ 2 ) = ∑ f(m jaz – x̄) 2 /(n-1)
Formula populacijske variance za združene podatke (str 2 ) = ∑ f(m jaz – x̄) 2 /n
kje,
- f je frekvenca vsakega intervala
- m jaz je sredina črke ithinterval
- x je povprečje združenih podatkov
Za združene podatke se povprečje izračuna kot
Srednja = ∑ (f jaz x jaz ) / ∑ f jaz
Formula variance za nezdružene podatke
Za nezdružene podatke je formula variance obravnavana spodaj,
- Vzorčna formula variance za nezdružene podatke (str 2 ) = ∑ (x jaz – x̄) 2 /(n-1)
- Formula populacijske variance za nezdružene podatke (str 2 ) = ∑ (x jaz – x̄) 2 /n
kje x je povprečje združenih podatkov
Formula za izračun variance
Formula, uporabljena za izračun variance, je obravnavana na spodnji sliki,

Kako izračunati varianco?
Na splošno varianca pomeni standardno varianco populacije. Koraki za izračun variance danega niza vrednosti so:
Korak 1: Izračunajte povprečje opazovanja z uporabo formule (povprečje = vsota opazovanj/število opazovanj)
2. korak: Izračunajte kvadrat razlike podatkovnih vrednosti od povprečja. (Vrednost podatkov – povprečje)2
3. korak: Izračunajte povprečje kvadratov razlik danih vrednosti, ki se imenujejo varianca nabora podatkov.
(Varianca = vsota kvadratov razlik / število opazovanj)
Varianca in standardni odklon
Varianca in Standardni odklon oboje je merilo osrednje težnje, ki nam pove, v kolikšni meri vrednosti nabora podatkov odstopajo glede na osrednjo ali srednjo vrednost nabora podatkov.
Obstaja določeno razmerje med varianco in standardnim odklonom za kateri koli nabor podatkov.
Varianca = (standardni odklon) 2
Varianca je opredeljena kot kvadrat standardnega odklona, tj. če vzamemo kvadrat standardnega odklona za katero koli skupino podatkov, dobimo varianco tega niza podatkov. varianca je definirana s simbolom str 2 ker str se uporablja za definiranje standardnega odklona nabora podatkov. Varianca nabora podatkov je izražena v kvadratnih enotah, medtem ko je standardna deviacija nabora podatkov izražena v enoti, podobni srednji vrednosti nabora podatkov.
Nauči se več: Varianca in standardni odklon
Varianca binomske porazdelitve
Binomska porazdelitev je diskretna porazdelitev verjetnosti, ki nam pove število pozitivnih izidov v binomskem poskusu, izvedenem n-krat. Rezultat binomskega poskusa je 0 ali 1, tj. pozitiven ali negativen.
V binomskem poskusu n poskusov in kjer je podana verjetnost vsakega poskusa str , potem je varianca binomske porazdelitve podana z uporabo,
str 2 = np (1 – p)
kje 'npr.' definirana kot povprečje vrednosti binomske porazdelitve.
Varianca Poissonove porazdelitve
Porazdelitev strupov je definirana kot diskretna porazdelitev verjetnosti, ki se uporablja za definiranje verjetnosti števila dogodkov 'n', ki se zgodijo v časovnem obdobju 'x'. Srednjo vrednost v Poissonovi porazdelitvi definira simbol l.
Pri Poissonovi porazdelitvi sta povprečje in varianca danega niza podatkov enaki. Varianca Poissonove porazdelitve je podana s formulo,
str 2 = λ
Varianca enakomerne porazdelitve
Pri enakomerni porazdelitvi so podatki porazdelitve verjetnosti zvezni. Rezultat teh poskusov je v območju med določeno zgornjo mejo in določeno spodnjo mejo, zato se te porazdelitve imenujejo tudi pravokotne porazdelitve. Če je zgornja meja ali največja meja b in spodnja meja ali najmanjša meja je a, potem se varianca enakomerne porazdelitve izračuna z uporabo formule,
str 2 = (1/12)(b – a) 2
Srednja enakomerna porazdelitev je podana z uporabo formule,
Srednja vrednost = (b + a) / 2
kje,
- b je zgornja meja enotne porazdelitve
- a je spodnja meja enotne porazdelitve
Varianca in kovarianca
Varianca nabora podatkov opredeljuje nestanovitnost vseh vrednosti nabora podatkov glede na srednjo vrednost nabora podatkov. Kovarianca nam pove, kako so naključne spremenljivke povezane med seboj, in nam pove, kako sprememba ene spremenljivke vpliva na spremembo drugih spremenljivk.
Kovarianca je lahko pozitivna ali negativna, pozitivna kovarianca pomeni, da se obe spremenljivki gibljeta v isto smer glede na srednjo vrednost, medtem ko negativna kovarianca pomeni, da se obe spremenljivki gibljeta v nasprotni smeri glede na srednjo vrednost.
Za dve naključni spremenljivki x in y, kjer je x odvisna spremenljivka in y neodvisna spremenljivka, se kovarianca izračuna z uporabo formule, navedene na spodnji priloženi sliki.

Lastnosti variance
Varianca se široko uporablja v matematiki, statistiki in drugih vejah znanosti za različne namene. Varianca ima različne lastnosti, ki se pogosto uporabljajo za reševanje različnih problemov. Nekatere osnovne lastnosti variance so,
- Varianca nabora podatkov je nenegativna količina in ničelna vrednost variance pomeni, da so vse vrednosti nabora podatkov enake.
- Višja vrednost variance nam pove, da so vse vrednosti podatkov niza podatkov močno razpršene, torej daleč od srednje vrednosti niza podatkov.
- Nižja vrednost variance nam pove, da so vse vrednosti podatkov niza podatkov blizu druga drugi, torej zelo blizu srednje vrednosti niza podatkov.
Za vsako konstanto 'c'
- Var(x + c) = Var(x)
kje x je naključna spremenljivka
- Var(cx) = c2
kje x je naključna spremenljivka
Prav tako, če a in b sta konstantna vrednost in x je torej naključna spremenljivka,
- Var(ax + b) = a2
Za neodvisne spremenljivke x1, x2, x3…,xnto vemo,
- Kje (x1+ x2+……+ xn) = Var(x1) + Kje(x2) +……..+Kje(xn)
Ljudje preberejo tudi:
- Pomeni
- Način
- Razlika med varianco in standardnim odklonom
Primeri formule variance
Primer 1: Izračunajte varianco vzorčnih podatkov: 7, 11, 15, 19, 24.
rešitev:
Imamo podatke, 7, 11, 15, 19, 24
Poiščite povprečje podatkov.
x̄ = (7 + 11 + 15 + 19 + 24)/5
= 76/5
= 15,2Z uporabo formule za varianco dobimo,
str2= ∑ (xjaz– x̄)2/(n – 1)
= (67,24 + 17,64 + 0,04 + 14,44 + 77,44)/(5 – 1)
= 176,8/4
= 44,2
Primer 2: Izračunajte število opazovanj, če je varianca podatkov 12 in je vsota kvadratov razlik podatkov od povprečja 156.
rešitev:
Imamo,
(xjaz– x̄)2= 156
str2= 12
Z uporabo formule za varianco dobimo,
str2= ∑ (xjaz– x̄)2/n
12 = 156/n
n = 156/12
n = 13
boto3
Primer 3: Izračunajte varianco za podane podatke
| xjaz | fjaz |
|---|---|
| 10 | 1 |
| 4 | 3 |
| 6 | 5 |
| 8 | 1 |
rešitev:
Srednja (x̄) = ∑(fjazxjaz)/∑(fjaz)
= (10×1 + 4×3 + 6×5 + 8×1)/(1+3+5+1)
= 60/10 = 6n = ∑(fjaz) = 1+3+5+1 = 10
xjaz
fjaz
fjazxjaz
(xjaz– x̄)
(xjaz– x̄)2
fjaz(xjaz– x̄)2
10 1 10 4 16 16 4 3 12 -2 4 12 6 5 30 0 0 0 8 1 8 2 4 8 zdaj,
str 2 = (∑ jaz n f jaz (x jaz – x̄) 2 /n)
= [(16 + 12 + 0 +8)/10]
= 3,6Varianca (σ2) = 3,6
Primer 4: Poiščite varianco naslednje podatkovne tabele
| Razred | Pogostost |
|---|---|
| 0-10 | 3 |
| 10-20 | 6 |
| 20-30 | 4 |
| 30-40 | 2 |
| 40-50 | 1 |
rešitev:
Razred
Xi
fjaz
f×Xi
Xi – μ
(Xi – μ)2
f×(Xi – μ)2
0-10
5
3
petnajst
- petnajst
225
675
10-20
petnajst
6
90
-5
25
150
20-30
25
4
100
5
25
100
30-40
35
2
70
petnajst
225
450
40-50
Štiri
1
Štiri
25
625
625
Skupaj
16
320
set proti zemljevidu
2000
Srednja (μ) = ∑(fi xi)/∑(fi)
= 320/16 = 20str 2 = (∑ jaz n f jaz (x jaz – m) 2 /n)
= [(2000)/(16)]
= (125)Varianca danega niza podatkov je 125.
Povzetek – Varianca
Varianca je statistična mera, ki kaže, koliko se vrednosti v nizu podatkov razlikujejo od povprečja. Pomaga nam razumeti širjenje ali razpršenost podatkovnih točk. Obstajata dve glavni vrsti variance: varianca populacije, ki meri, kako se podatkovne točke v celotni populaciji razširijo, in varianca vzorca, ki meri, kako se podatkovne točke v vzorcu razširijo. Varianca je označena s σ² in je kvadrat standardnega odklona. Za izračun variance poiščete povprečje podatkov, odštejete povprečje od vsake podatkovne točke, kvadrirate razlike in nato povprečite te kvadratne razlike. Varianca je pomembna, ker nam pomaga razumeti variabilnost znotraj nabora podatkov. Visoka varianca pomeni, da so podatkovne točke zelo razpršene, nizka varianca pa pomeni, da so blizu povprečja. Varianca je vedno nenegativna, saj vključuje kvadriranje razlik.
Pogosta vprašanja o Variance
Kaj je varianca v statistiki?
Varianca je opredeljena kot razpon vrednosti nabora podatkov glede na srednjo vrednost nabora podatkov. Varianca niza podatkov pove, v kolikšni meri se vrednosti v določenem nizu podatkov razlikujejo od srednje vrednosti.
Kaj je simbol variance?
Uporabljamo simbole σ2, s2 in Var(x) za označevanje variance nabora podatkov.
Kaj je formula variance?
Varianca nabora podatkov se izračuna po formuli,
str 2 = E[( X – m) 2 ]
Kaj pove Variance?
Varianca se uporablja za ugotavljanje obsega razpršenosti podatkov, tj. pove nam, kako so vrednosti v nizu podatkov razpršene glede na srednjo vrednost. Za večjo vrednost variance so vrednosti široko razpršene glede na srednjo vrednost, medtem ko so glede na manjšo vrednost variance vrednosti tesno razpršene glede na srednjo vrednost
Kakšno je razmerje med varianco in standardnim odklonom?
Za dani nabor podatkov je varianca nabora podatkov kvadrat standardnega odklona tega nabora podatkov. To razmerje je izraženo kot,
Varianca = (standardni odklon) 2
Kako izračunate varianco?
Za izračun variance najprej poiščete povprečje (povprečje) niza podatkov. Nato od vsake podatkovne točke odštejte povprečje in kvadrirajte rezultat. Na koncu izračunajte povprečje teh kvadratov razlik.
Zakaj je varianca pomembna?
Varianca je ključnega pomena za razumevanje porazdelitve podatkov znotraj nabora podatkov. Pomaga pri določanju, kako razpršene so podatkovne točke od povprečne vrednosti, kar kaže na variabilnost ali doslednost v podatkih.
Kakšna je razlika med varianco in standardnim odklonom?
Medtem ko tako varianca kot standardni odklon merita razpršenost podatkov, je standardni odklon kvadratni koren variance. Standardni odklon je izražen v istih enotah kot podatki, zaradi česar je lažje razlagati za označevanje širjenja.
Ali je lahko varianca negativna?
Ne, varianca ne more biti negativna. Ker se izračuna kot povprečje kvadratov razlik od povprečja, je dobljena vrednost vedno nenegativna.