Wilcoxonen hein froga
Estatistikan, Wilcoxonen hein froga bi datu multzo independente populazio berekoak diren erabakitzeko froga estatistiko bat da, homogeneotasun froga bat alegia. Froga ez parametrikoa da, hau da, ez du datuei buruz aurreko eredurik ezartzen, eta aldagaiak eskala ordinal edo kuantitatibo batean neurtuak izatea soilik eskatzen du. Mann-Whitney U frogaren baliokidea da: fi frogen arteko diferentzia bakarra frogarako erabiltzen den estatistikoa da.
Adibide bat [aldatu]
15 urteko mutil eta neska zenbaiti kirol-froga bat egin zaie. Hauek dira lortutako datuak:
-
-
-
Mutilak 13.4 15.6 12.8 14.2
-
-
-
-
-
Neskak 14.4 13.6 16.8 18.2 17.4
-
-
Neskak eta mutilak populazio berekoak izan eta, beraz, datu-multzo bakar batean har daitezkeen erabaki behar da Wilcoxonen hein frogaren bitartez.
Lehenbizi, datu guztiak batera jartzen dira modu ordenatuan txikienetik handienera, datu bakoitza mutil edo neska bati dagokion zehaztuz, eta datu bakoitzari dagokion heina edo maila ezarriz eta mutilei dagozkien heinak nabarmenduz edo markatuz:
-
-
-
12.8 13.4 13.6 14.2 14.4 15.6 16.8 17.4 18.2 M M N M N M N N N 1 2 3 4 5 6 7 8 9
-
-
Frogaren estatistikoa W hein edo mailen batura da:
Hipotesi nulupean bi populazioak berdintzat jotzen dira eta horrela, W bi estatistikoek berdintsuak izateko joera izango dute. Frogarako ohikoa da W' bi estatistikoetatik W0 txikiena hartzea eta, beraz, kontrastea burutzeko W0 txikiena harturik kalkulatu beharreko probabilitatea hau izango da: P[W<W0].
Erabakia hartzeko, Wilcoxonen hein frogarako taulak daude, bi datu-multzoen tamaina ezberdinetarako (n1: lagin handieneko elementu kopurua, n2: lagin txikieneko elementu kopurua):
| n1 | n2 | α adierazgarritasun-maila | |||
|---|---|---|---|---|---|
| 0.20 | 0.10 | 0.05 | 0.01 | ||
| 3 | 2 | 3 | (-) | (-) | (-) |
| 3 | 3 | 7 | 6 | (-) | (-) |
| 4 | 2 | 3 | (-) | (-) | (-) |
| 4 | 3 | 7 | 6 | (-) | (-) |
| 4 | 4 | 13 | 10 | 11 | (-) |
| 5 | 2 | 4 | 3 | (-) | (-) |
| 5 | 3 | 8 | 7 | 6 | (-) |
| 5 | 4 | 14 | 12 | 11 | (-) |
| 5 | 5 | 20 | 19 | 17 | 15 |
Adibidean, %10eko adierazgarritasun-maila aukeratzen bada, taulako balio kritikoa 12 da.
. Beraz, H0 hipotesi nulua onartu eta neska eta mutilen datuak populazio berekoak izan eta batera jar daitezkeela erabakitzen da.
Bi W estatistikoetatik txikiena aukeratzearen arrazoia bi estatistikoen baliokidetasunean datza: bata emanda, bestea eman daiteke. Bi laginak batera jarrita,
eta
tamainakoak,
hein edo ordena guztien batura izango da:
Lagin tamaina handiak [aldatu]
10 arteko tamainako laginetarako taulak badaude. Lagin tamaina handiagoetarako, hurbilketa normala erabil daiteke. Homogeneotasunaren hipotesi nulupean W heinen batura honela banatzen dela froga daiteke,
eta
bi laginetako tamainak:
Adibidez,
eta
izanik, zer erabaki behar da
suertatu bada?
Aztertu behar da aurretik
asko edo gutxi den frogaren norabidea finkatzeko:
Beraz, kalkulatu beharreko probabilitatea
izango da (145 balioa espero zitekeen 115 baino handiagoa delako):
%10eko adierazgarritasun-maila baterako, baztertu behar da homogeneotsuna
betetzen delako. Ohartu behar da, froga alde bikoa dela eta, beraz, W oso handia zein oso txikia denean baztertu behar dela hipotesi nulua.





![W_1 \sim N(\mu=115,\ \sigma=15.16) \rightarrow P[W_1>145]=P[Z>(145-115)/15.16]=P[Z>1.98]=0.024](http://upload.wikimedia.org/math/a/f/b/afb7b9c3d6feaec3260995126fd0f8cd.png)