logo

Razumevanje testiranja hipotez

Preizkušanje hipotez vključuje oblikovanje predpostavk o populacijskih parametrih na podlagi vzorčne statistike in strogo ovrednotenje teh predpostavk glede na empirične dokaze. Ta članek osvetljuje pomen testiranja hipotez in kritične korake, vključene v proces.

Kaj je testiranje hipotez?

Preizkušanje hipotez je statistična metoda, ki se uporablja za sprejemanje statističnih odločitev z uporabo eksperimentalnih podatkov. Preizkušanje hipotez je v bistvu predpostavka, ki jo naredimo o parametru populacije. Ocenjuje dve medsebojno izključujoči izjavi o populaciji, da ugotovi, katero izjavo najbolje podpirajo vzorčni podatki.



primer: Pravite, da je povprečna višina v razredu 30 ali da je fant višji od dekleta. Vse to so predpostavke, ki jih predpostavljamo, in potrebujemo nekaj statističnih načinov, da jih dokažemo. Potrebujemo nekaj matematičnega zaključka, ne glede na to, kar domnevamo, da je res.

Definiranje hipotez

  • Ničelna hipoteza (H 0 ): V statistiki je nična hipoteza splošna izjava ali privzeto stališče, da ni povezave med dvema izmerjenima primeroma ali povezave med skupinama. Z drugimi besedami, to je osnovna predpostavka ali narejena na podlagi poznavanja problema.
    Primer : Povprečna proizvodnja podjetja je 50 enot/na da H0: mu= 50.
  • Alternativna hipoteza (H 1 ): Alternativna hipoteza je hipoteza, uporabljena pri testiranju hipotez, ki je v nasprotju z ničelno hipotezo.
    Primer: proizvodnja podjetja ni enaka 50 enotam na dan, tj. H1: mu 
petdeset.

Ključni pogoji za preizkušanje hipotez

  • Stopnja pomembnosti : Nanaša se na stopnjo pomembnosti, v kateri sprejmemo ali zavrnemo ničelno hipotezo. 100-odstotna natančnost ni mogoča za sprejetje hipoteze, zato izberemo raven pomembnosti, ki je običajno 5-odstotna. To je običajno označeno z alphain na splošno je 0,05 ali 5 %, kar pomeni, da bi moral biti vaš rezultat 95 % zanesljiv, da bi dal podoben rezultat v vsakem vzorcu.
  • P-vrednost: The vrednost P ali izračunana verjetnost je verjetnost, da se najdejo opazovani/ekstremni rezultati, ko je ničelna hipoteza (H0) problema, ki ga je podala študija, resnična. Če je vaša P-vrednost nižja od izbrane ravni pomembnosti, zavrnete ničelno hipotezo, tj. sprejmete, da vaš vzorec trdi, da podpira alternativno hipotezo.
  • Testna statistika: Preizkusna statistika je številčna vrednost, izračunana iz vzorčnih podatkov med preizkusom hipoteze, ki se uporablja za določitev, ali zavrniti ničelno hipotezo. Primerja se s kritično vrednostjo ali p-vrednostjo, da se sprejmejo odločitve o statistični pomembnosti opazovanih rezultatov.
  • Kritična vrednost : Kritična vrednost v statistiki je prag ali mejna vrednost, ki se uporablja za določitev, ali zavrniti ničelno hipotezo v preizkusu hipoteze.
  • Stopnje svobode: Stopnje svobode so povezane s spremenljivostjo ali svobodo, ki jo imamo pri ocenjevanju parametra. Stopnje svobode so povezane z velikostjo vzorca in določajo obliko.

Zakaj uporabljamo testiranje hipotez?

Preizkušanje hipotez je pomemben postopek v statistiki. Preizkušanje hipotez oceni dve medsebojno izključujoči izjavi o populaciji, da se ugotovi, katera izjava je najbolj podprta z vzorčnimi podatki. Ko rečemo, da so ugotovitve statistično pomembne, zahvaljujoč testiranju hipotez.

Enostranski in dvostranski test

En test z repom se osredotoča na eno smer, večjo ali manjšo od določene vrednosti. Enostranski test uporabljamo, kadar obstaja jasno pričakovanje o smeri, ki temelji na predhodnem znanju ali teoriji. Kritično območje se nahaja samo na eni strani porazdelitvene krivulje. Če vzorec pade v to kritično območje, se ničelna hipoteza zavrne v korist alternativne hipoteze.



Enodelni test

Obstajata dve vrsti enostranskih testov:

  • Levi (levostranski) test: Alternativna hipoteza trdi, da je prava vrednost parametra manjša od ničelne hipoteze. Primer: H0: mu geq 50in H1:
  • in H1: mu>50

Dvostranski test

Dvostranski test upošteva obe smeri, večjo in manjšo od določene vrednosti. Dvostranski test uporabljamo, ko ni posebnega pričakovanega smeri in želimo zaznati kakršno koli pomembno razliko.

Primer: H0: in =50 in H1: mu 
eq 50



Kaj so napake tipa 1 in tipa 2 pri testiranju hipotez?

Pri testiranju hipotez, Napake tipa I in tipa II sta dve možni napaki, ki ju raziskovalci lahko naredijo, ko sklepajo o populaciji na podlagi vzorca podatkov. Te napake so povezane z odločitvami glede ničelne hipoteze in alternativne hipoteze.

  • Napaka tipa I: Ko zavrnemo ničelno hipotezo, čeprav je bila ta hipoteza resnična. Napaka tipa I je označena z alfa( alpha).
  • Napake tipa II: Ko sprejmemo ničelno hipotezo, vendar je napačna. Napake tipa II so označene z beta( eta).


Ničelna hipoteza je resnična

Ničelna hipoteza je napačna

omejitve e-bančništva

Ničelna hipoteza je resnična (sprejmi)

Pravilna odločitev

Napaka tipa II (lažno negativno)

Alternativna hipoteza je resnična (Zavrni)

Napaka tipa I (lažno pozitivno)

Pravilna odločitev

Kako deluje testiranje hipotez?

1. korak: Definirajte ničelno in alternativno hipotezo

Navedite ničelno hipotezo ( H_0), ki ne predstavlja nobenega učinka, in alternativna hipoteza ( H_1​), kar kaže na učinek ali razliko.

Najprej identificiramo problem, o katerem želimo domnevati, ob upoštevanju, da bi morale biti naše predpostavke med seboj v nasprotju, ob predpostavki, Normalno porazdeljeni podatki.

2. korak – izberite stopnjo pomembnosti

Izberite stopnjo pomembnosti ( alpha), običajno 0,05, da se določi prag za zavrnitev ničelne hipoteze. Zagotavlja veljavnost našemu preizkusu hipotez in zagotavlja, da imamo dovolj podatkov za podporo naših trditev. Običajno svojo stopnjo pomembnosti določimo pred testom. The p-vrednost je merilo, ki se uporablja za izračun naše vrednosti pomembnosti.

3. korak Zberite in analizirajte podatke.

Z opazovanjem ali eksperimentiranjem zberite ustrezne podatke. Analizirajte podatke z ustreznimi statističnimi metodami, da dobite testno statistiko.

Korak 4-Izračunajte testno statistiko

Podatki za teste so ovrednoteni, v tem koraku iščemo različne ocene na podlagi značilnosti podatkov. Izbira testne statistike je odvisna od vrste preizkusa hipoteze, ki se izvaja.

Obstajajo različni testi hipotez, od katerih je vsak primeren za različne cilje za izračun našega testa. To je lahko a Z-test , Hi-kvadrat , T-test , in tako naprej.

  1. Z-test : če so znane populacijske sredine in standardni odkloni. Običajno se uporablja Z-statistika.
  2. t-test : Če standardni odkloni populacije niso znani. velikost vzorca pa je majhna, kot je primernejša statistika t-testa.
  3. Hi-kvadrat test : Hi-kvadrat test se uporablja za kategorične podatke ali za testiranje neodvisnosti v kontingenčnih tabelah
  4. F-test : F-test se pogosto uporablja pri analizi variance (ANOVA) za primerjavo varianc ali testiranje enakosti povprečij v več skupinah.

Imamo manjši nabor podatkov, zato je T-test bolj primeren za preverjanje naše hipoteze.

T-statistika je merilo razlike med srednjimi vrednostmi dveh skupin glede na variabilnost znotraj vsake skupine. Izračuna se kot razlika med vzorčnimi sredinami, deljena s standardno napako razlike. Znana je tudi kot t-vrednost ali t-rezultat.

5. korak – Primerjava testne statistike:

V tej fazi se odločimo, kje naj sprejmemo ničelno hipotezo ali zavrnemo ničelno hipotezo. Obstajata dva načina, da se odločimo, kje naj sprejmemo ali zavrnemo ničelno hipotezo.

Metoda A: Uporaba kritičnih vrednosti

Če primerjamo testno statistiko in tabelirano kritično vrednost, ki jo imamo,

  • Če je testna statistika>kritična vrednost: zavrnite ničelno hipotezo.
  • Če je testna statistika ≤ kritična vrednost: ni uspelo zavrniti ničelne hipoteze.

Opomba: Kritične vrednosti so vnaprej določene mejne vrednosti, ki se uporabljajo za sprejemanje odločitev pri testiranju hipotez. Določiti kritične vrednosti za preizkušanje hipotez se običajno sklicujemo na tabelo statistične porazdelitve, kot so tabele normalne porazdelitve ali t-porazdelitve, ki temeljijo na.

Metoda B: Uporaba P-vrednosti

Do zaključka lahko pridemo tudi z uporabo p-vrednosti,

  • Če je p-vrednost manjša ali enaka stopnji pomembnosti, tj. pleqalfa), zavrnete ničelno hipotezo. To kaže, da je malo verjetno, da bi se opazovani rezultati pojavili zgolj po naključju, kar dokazuje alternativno hipotezo.
  • Če je p-vrednost večja od ravni pomembnosti, tj. pgeq alfa), ničelne hipoteze ne zavrnete. To nakazuje, da so opazovani rezultati skladni s tem, kar bi pričakovali pod ničelno hipotezo.

Opomba : p-vrednost je verjetnost, da dobimo testno statistiko, ki je tako ekstremna ali bolj ekstremna od tiste, opažene v vzorcu, ob predpostavki, da je ničelna hipoteza resnična. Določiti p-vrednost za preizkušanje hipotez se običajno sklicujemo na tabelo statistične porazdelitve, kot so tabele normalne porazdelitve ali t-porazdelitve, ki temeljijo na.

7. korak – Razlaga rezultatov

Končno lahko zaključimo naš poskus z metodo A ali B.

Izračun testne statistike

Za potrditev naše hipoteze o parametru populacije, ki ga uporabljamo statistične funkcije . Z-rezultat, p-vrednost in raven pomembnosti (alfa) uporabljamo za dokaz naše hipoteze za normalno porazdeljenih podatkov .

1. Z-statistika:

Ko so znani povprečja populacije in standardni odkloni.

z = frac{ar{x} - mu}{frac{sigma}{sqrt{n}}}

kje,

  • ar{x}je vzorčna sredina,
  • μ predstavlja povprečje populacije,
  • σ je standardni odklon
  • in n je velikost vzorca.

2. T-statistika

T test se uporablja, če je n<30,

izračun t-statistike je podan z:

t=frac{x̄-Μ}{s/sqrt{n}}

kje,

  • t = t-rezultat,
  • x̄ = povprečje vzorca
  • μ = povprečje populacije,
  • s = standardni odklon vzorca,
  • n = velikost vzorca

3. Hi-kvadrat test

Hi-kvadrat test za kategorične podatke o neodvisnosti (nenormalno porazdeljeni) z uporabo:

chi^2 = sum frac{(O_{ij} - E_{ij})^2}{E_{ij}}

kje,

  • O_{ij}je opažena frekvenca v celici {ij}
  • i,j so indeksi vrstic oziroma stolpcev.
  • E_{ij}je pričakovana frekvenca v celici {ij}, izračunano kot:
    frac{{	ext{{Skupno število vrstic}} 	imes 	ext{{Skupno število stolpcev}}}}{{	ext{{Skupno število opazovanj}}}}

Primer testiranja hipotez v resničnem življenju

Preučimo testiranje hipotez z uporabo dveh resničnih življenjskih situacij,

Primer A: D ali novo zdravilo vpliva na krvni tlak?

Predstavljajte si, da je farmacevtsko podjetje razvilo novo zdravilo, za katerega menijo, da lahko učinkovito zniža krvni tlak pri bolnikih s hipertenzijo. Preden dajo zdravilo na trg, morajo opraviti študijo, da ocenijo njegov vpliv na krvni tlak.

podatki:

ponovi zemljevid v Javi
  • Pred zdravljenjem: 120, 122, 118, 130, 125, 128, 115, 121, 123, 119
  • Po zdravljenju: 115, 120, 112, 128, 122, 125, 110, 117, 119, 114

Korak 1 : Določite hipotezo

  • Ničelna hipoteza : (H0)Novo zdravilo ne vpliva na krvni tlak.
  • Nadomestna hipoteza : (H1)Novo zdravilo vpliva na krvni tlak.

2. korak: Določite stopnjo pomembnosti

Upoštevajmo stopnjo pomembnosti pri 0,05, kar kaže na zavrnitev ničelne hipoteze.

Če dokazi kažejo na manj kot 5-odstotno možnost opazovanja rezultatov zaradi naključne variacije.

3. korak : Izračunajte testno statistiko

Uporaba parni T-test analizirajte podatke, da dobite testno statistiko in p-vrednost.

Statistika testa (npr. T-statistika) se izračuna na podlagi razlik med meritvami krvnega tlaka pred in po zdravljenju.

t = m/(s/√n)

Kje:

  • m = povprečje razlike, tj X po, X prej
  • s = standardna deviacija razlike (d), tj d jaz ​= X po, jaz ​− X prej,
  • n = velikost vzorca,

potem je m = -3,9, s = 1,8 in n = 10

izračunamo T-statistiko = -9 na podlagi formule za parni t test

4. korak: Poiščite p-vrednost

Izračunana t-statistika je -9 in prostostnih stopinj df = 9, lahko p-vrednost najdete s statistično programsko opremo ali tabelo t-distribucije.

tako je p-vrednost = 8,538051223166285e-06

5. korak: rezultat

  • Če je p-vrednost manjša ali enaka 0,05, raziskovalci zavrnejo ničelno hipotezo.
  • Če je p-vrednost večja od 0,05, ne uspejo zavrniti ničelne hipoteze.

Zaključek: Ker je p-vrednost (8,538051223166285e-06) nižja od stopnje pomembnosti (0,05), raziskovalci zavračajo ničelno hipotezo. Obstajajo statistično pomembni dokazi, da je povprečni krvni tlak pred in po zdravljenju z novim zdravilom različen.

Python implementacija testiranja hipotez

Ustvarimo testiranje hipotez s pythonom, kjer testiramo, ali novo zdravilo vpliva na krvni tlak. Za ta primer bomo uporabili parni T-test. Uporabili bomo scipy.stats> knjižnica za T-test.

Naš prvi problem v resničnem življenju bomo implementirali prek pythona,

Python3

import> numpy as np> from> scipy>import> stats> # Data> before_treatment>=> np.array([>120>,>122>,>118>,>130>,>125>,>128>,>115>,>121>,>123>,>119>])> after_treatment>=> np.array([>115>,>120>,>112>,>128>,>122>,>125>,>110>,>117>,>119>,>114>])> # Step 1: Null and Alternate Hypotheses> # Null Hypothesis: The new drug has no effect on blood pressure.> # Alternate Hypothesis: The new drug has an effect on blood pressure.> null_hypothesis>=> 'The new drug has no effect on blood pressure.'> alternate_hypothesis>=> 'The new drug has an effect on blood pressure.'> # Step 2: Significance Level> alpha>=> 0.05> # Step 3: Paired T-test> t_statistic, p_value>=> stats.ttest_rel(after_treatment, before_treatment)> # Step 4: Calculate T-statistic manually> m>=> np.mean(after_treatment>-> before_treatment)> s>=> np.std(after_treatment>-> before_treatment, ddof>=>1>)># using ddof=1 for sample standard deviation> n>=> len>(before_treatment)> t_statistic_manual>=> m>/> (s>/> np.sqrt(n))> # Step 5: Decision> if> p_value <>=> alpha:> >decision>=> 'Reject'> else>:> >decision>=> 'Fail to reject'> # Conclusion> if> decision>=>=> 'Reject'>:> >conclusion>=> 'There is statistically significant evidence that the average blood pressure before and after treatment with the new drug is different.'> else>:> >conclusion>=> 'There is insufficient evidence to claim a significant difference in average blood pressure before and after treatment with the new drug.'> # Display results> print>(>'T-statistic (from scipy):'>, t_statistic)> print>(>'P-value (from scipy):'>, p_value)> print>(>'T-statistic (calculated manually):'>, t_statistic_manual)> print>(f>'Decision: {decision} the null hypothesis at alpha={alpha}.'>)> print>(>'Conclusion:'>, conclusion)>
>
>

Izhod:

T-statistic (from scipy): -9.0 P-value (from scipy): 8.538051223166285e-06 T-statistic (calculated manually): -9.0 Decision: Reject the null hypothesis at alpha=0.05. Conclusion: There is statistically significant evidence that the average blood pressure before and after treatment with the new drug is different.>

V zgornjem primeru glede na T-statistiko približno -9 in izjemno majhno p-vrednost rezultati kažejo močan primer za zavrnitev ničelne hipoteze pri stopnji pomembnosti 0,05.

  • Rezultati kažejo, da ima novo zdravilo, zdravljenje ali poseg pomemben učinek na znižanje krvnega tlaka.
  • Negativna T-statistika kaže, da je povprečni krvni tlak po zdravljenju bistveno nižji od domnevne povprečne vrednosti populacije pred zdravljenjem.

Primer B : Raven holesterola v populaciji

podatki: Vzamejo vzorec 25 oseb, ki jim izmerijo raven holesterola.

Raven holesterola (mg/dL): 205, 198, 210, 190, 215, 205, 200, 192, 198, 205, 198, 202, 208, 200, 205, 198, 205, 210, 192, 205, 198, 205, 210, 192, 205.

Povprečno število prebivalcev = 200

Standardni odklon populacije (σ): 5 mg/dL (podano za to težavo)

Korak 1: Definirajte hipotezo

  • Ničelna hipoteza (H 0 ): Povprečna raven holesterola v populaciji je 200 mg/dL.
  • Alternativna hipoteza (H 1 ): Povprečna raven holesterola v populaciji se razlikuje od 200 mg/dL.

2. korak: Določite stopnjo pomembnosti

Ker smer odstopanja ni podana, predpostavljamo dvostranski test in na podlagi normalne porazdelitvene tabele lahko kritične vrednosti za raven pomembnosti 0,05 (dvostranski) izračunamo prek z-tabela in sta približno -1,96 in 1,96.

3. korak : Izračunajte testno statistiko

Testna statistika se izračuna z uporabo formule z Z = (203,8 - 200) / (5 div sqrt{25})in temu primerno dobimo, Z =2,039999999999992.

4. korak: rezultat

Ker je absolutna vrednost testne statistike (2,04) večja od kritične vrednosti (1,96), zavračamo ničelno hipotezo. In zaključite, da obstajajo statistično pomembni dokazi, da se povprečna raven holesterola v populaciji razlikuje od 200 mg/dL.

Python implementacija testiranja hipotez

Python3

import> scipy.stats as stats> import> math> import> numpy as np> # Given data> sample_data>=> np.array(> >[>205>,>198>,>210>,>190>,>215>,>205>,>200>,>192>,>198>,>205>,>198>,>202>,>208>,>200>,>205>,>198>,>205>,>210>,>192>,>205>,>198>,>205>,>210>,>192>,>205>])> population_std_dev>=> 5> population_mean>=> 200> sample_size>=> len>(sample_data)> # Step 1: Define the Hypotheses> # Null Hypothesis (H0): The average cholesterol level in a population is 200 mg/dL.> # Alternate Hypothesis (H1): The average cholesterol level in a population is different from 200 mg/dL.> # Step 2: Define the Significance Level> alpha>=> 0.05> # Two-tailed test> # Critical values for a significance level of 0.05 (two-tailed)> critical_value_left>=> stats.norm.ppf(alpha>/>2>)> critical_value_right>=> ->critical_value_left> # Step 3: Compute the test statistic> sample_mean>=> sample_data.mean()> z_score>=> (sample_mean>-> population_mean)>/> > >(population_std_dev>/> math.sqrt(sample_size))> # Step 4: Result> # Check if the absolute value of the test statistic is greater than the critical values> if> abs>(z_score)>>max>(>abs>(critical_value_left),>abs>(critical_value_right)):> >print>(>'Reject the null hypothesis.'>)> >print>(>'There is statistically significant evidence that the average cholesterol level in the population is different from 200 mg/dL.'>)> else>:> >print>(>'Fail to reject the null hypothesis.'>)> >print>(>'There is not enough evidence to conclude that the average cholesterol level in the population is different from 200 mg/dL.'>)>
>
>

Izhod:

Reject the null hypothesis. There is statistically significant evidence that the average cholesterol level in the population is different from 200 mg/dL.>

Omejitve testiranja hipotez

  • Čeprav je uporabna tehnika, preizkušanje hipotez ne ponuja celovitega razumevanja preučevane teme. Ne da bi v celoti odražal zapletenost ali celoten kontekst pojavov, se osredotoča na določene hipoteze in statistično pomembnost.
  • Natančnost rezultatov testiranja hipotez je odvisna od kakovosti razpoložljivih podatkov in ustreznosti uporabljenih statističnih metod. Netočni podatki ali slabo oblikovane hipoteze lahko vodijo do napačnih zaključkov.
  • Zanašanje zgolj na preizkušanje hipotez lahko povzroči, da analitiki spregledajo pomembne vzorce ali razmerja v podatkih, ki niso zajeti s posebnimi hipotezami, ki se testirajo. Ta omejitev poudarja pomen dopolnjevanja testiranja hipotez z drugimi analitičnimi pristopi.

Zaključek

Preizkušanje hipotez je temelj statistične analize, ki podatkovnim znanstvenikom omogoča krmarjenje po negotovostih in ustvarjanje verodostojnih sklepov iz vzorčnih podatkov. S sistematičnim definiranjem ničelnih in alternativnih hipotez, izbiro ravni pomembnosti in uporabo statističnih testov lahko raziskovalci ocenijo veljavnost svojih predpostavk. Članek pojasnjuje tudi kritično razlikovanje med napakami tipa I in tipa II ter zagotavlja celovito razumevanje niansiranega procesa odločanja, ki je del testiranja hipotez. Primer testiranja učinka novega zdravila na krvni tlak iz resničnega življenja z uporabo seznanjenega T-testa prikazuje praktično uporabo teh načel in poudarja pomen statistične natančnosti pri odločanju na podlagi podatkov.

Pogosto zastavljena vprašanja (FAQ)

1. Katere so 3 vrste preizkusa hipotez?

Obstajajo tri vrste preizkusov hipotez: desnorepi, levorepi in dvorepi. Desnorepi testi ocenijo, ali je parameter večji, levorepi, če je manjši. Dvostranski testi preverjajo nesmerne razlike, večje ali manjše.

2. Katere so 4 komponente testiranja hipotez?

Ničelna hipoteza ( H_o): Ni učinka ali razlike.

Alternativna hipoteza ( H_1): Učinek ali razlika obstaja.

Stopnja pomembnosti ( alpha): Tveganje zavrnitve ničelne hipoteze, če je resnična (napaka tipa I).

Testna statistika: številčna vrednost, ki predstavlja opažene dokaze proti ničelni hipotezi.

3. Kaj je testiranje hipotez v ML?

Statistična metoda za ocenjevanje učinkovitosti in veljavnosti modelov strojnega učenja. Preizkuša specifične hipoteze o vedenju modela, na primer, ali značilnosti vplivajo na napovedi ali če se model dobro posplošuje na nevidne podatke.

4. Kakšna je razlika med Pytestom in hipotezo v Pythonu?

Pytest je namenjen splošnemu testnemu ogrodju za kodo Python, medtem ko je Hypothesis testni okvir za Python, ki temelji na lastnostih in se osredotoča na generiranje testnih primerov na podlagi določenih lastnosti kode.