Wilcoxonen hein froga

Wikipedia(e)tik
Hona jo: nabigazioa, Bilatu

Estatistikan, Wilcoxonen hein froga bi datu multzo independente populazio berekoak diren erabakitzeko froga estatistiko bat da, homogeneotasun froga bat alegia. Froga ez parametrikoa da, hau da, ez du datuei buruz aurreko eredurik ezartzen, eta aldagaiak eskala ordinal edo kuantitatibo batean neurtuak izatea soilik eskatzen du. Mann-Whitney U frogaren baliokidea da: fi frogen arteko diferentzia bakarra frogarako erabiltzen den estatistikoa da.

Adibide bat[aldatu | aldatu iturburu kodea]

15 urteko mutil eta neska zenbaiti kirol-froga bat egin zaie. Hauek dira lortutako datuak:

Mutilak 13.4 15.6 12.8 14.2
Neskak 14.4 13.6 16.8 18.2 17.4

Neskak eta mutilak populazio berekoak izan eta, beraz, datu-multzo bakar batean har daitezkeen erabaki behar da Wilcoxonen hein frogaren bitartez.

Lehenbizi, datu guztiak batera jartzen dira modu ordenatuan txikienetik handienera, datu bakoitza mutil edo neska bati dagokion zehaztuz, eta datu bakoitzari dagokion heina edo maila ezarriz eta mutilei dagozkien heinak nabarmenduz edo markatuz:

12.8 13.4 13.6 14.2 14.4 15.6 16.8 17.4 18.2
M M N M N M N N N
1 2 3 4 5 6 7 8 9

Frogaren estatistikoa W hein edo mailen batura da:

W_{m}=1+2+4+6+=13\,
W_{n}=3+5+7+8+9=32\,

Hipotesi nulupean bi populazioak berdintzat jotzen dira eta horrela, W bi estatistikoek berdintsuak izateko joera izango dute. Frogarako ohikoa da W' bi estatistikoetatik W0 txikiena hartzea eta, beraz, kontrastea burutzeko W0 txikiena harturik kalkulatu beharreko probabilitatea hau izango da: P[W<W0].

Erabakia hartzeko, Wilcoxonen hein frogarako taulak daude, bi datu-multzoen tamaina ezberdinetarako (n1: lagin handieneko elementu kopurua, n2: lagin txikieneko elementu kopurua):

Wilcoxonen hein frogarako taula
n1 n2 α adierazgarritasun-maila
0.20 0.10 0.05 0.01
3 2 3 (-) (-) (-)
3 3 7 6 (-) (-)
4 2 3 (-) (-) (-)
4 3 7 6 (-) (-)
4 4 13 10 11 (-)
5 2 4 3 (-) (-)
5 3 8 7 6 (-)
5 4 14 12 11 (-)
5 5 20 19 17 15

Adibidean, %10eko adierazgarritasun-maila aukeratzen bada, taulako balio kritikoa 12 da. W_m=13 > 12. Beraz, H0 hipotesi nulua onartu eta neska eta mutilen datuak populazio berekoak izan eta batera jar daitezkeela erabakitzen da.

Bi W estatistikoetatik txikiena aukeratzearen arrazoia bi estatistikoen baliokidetasunean datza: bata emanda, bestea eman daiteke. Bi laginak batera jarrita, n_1\, eta n_2\, tamainakoak, W_1+W_2\, hein edo ordena guztien batura izango da:

W_1+W_2=1+2+3+\ldots+(n_1+n_2)=(n_1+n_2)\frac{1+(n_1+n_2)}{2}

Lagin tamaina handiak[aldatu | aldatu iturburu kodea]

10 arteko tamainako laginetarako taulak badaude. Lagin tamaina handiagoetarako, hurbilketa normala erabil daiteke. Homogeneotasunaren hipotesi nulupean W heinen batura honela banatzen dela froga daiteke, n_1\, eta n_2\, bi laginetako tamainak:

W_1 \sim N\Big(\mu=\frac{n_1(n_1+n_2+1)}{2},\ \sigma=\sqrt{\frac{n_1n_2(n_1+n_2+1)}{12}}\Big)


Adibidez, n_1=10\, eta n_2=12\, izanik, zer erabaki behar da W_1=145\, suertatu bada?


Aztertu behar da aurretik W_1=145\, asko edo gutxi den frogaren norabidea finkatzeko:


\mu(W_1)=\frac{10 \times 23}{2}=115\,

Beraz, kalkulatu beharreko probabilitatea P(W_1>145) izango da (145 balioa espero zitekeen 115 baino handiagoa delako):

W_1 \sim N(\mu=115,\ \sigma=15.16) \rightarrow P[W_1>145]=P[Z>(145-115)/15.16]=P[Z>1.98]=0.024

%10eko adierazgarritasun-maila baterako, baztertu behar da homogeneotsuna 0.024<0.10/2\, betetzen delako. Ohartu behar da, froga alde bikoa dela eta, beraz, W oso handia zein oso txikia denean baztertu behar dela hipotesi nulua.

Kanpo loturak[aldatu | aldatu iturburu kodea]