Mann–Whitneyren U proba: berrikuspenen arteko aldeak

Wikipedia, Entziklopedia askea
Ezabatutako edukia Gehitutako edukia
Joxemai (eztabaida | ekarpenak)
tNo edit summary
Joxemai (eztabaida | ekarpenak)
No edit summary
149. lerroa: 149. lerroa:


::<math>W_1+W_2=1+2+3+\ldots+(n_1+n_2)=(n_1+n_2)\frac{1+(n_1+n_2)}{2}</math>
::<math>W_1+W_2=1+2+3+\ldots+(n_1+n_2)=(n_1+n_2)\frac{1+(n_1+n_2)}{2}</math>

== Lagin tamaina handiak ==
10 arteko tamainako laginetarako taulak badaude. Lagin tamaina handiagoetarako, hurbilketa normala erabil daiteke. Homogeneotasunaren hipotesi nulupean W heinen batura honela banatzen dela froga daiteke, <math>n_1\,</math> eta <math>n_2\,</math> bi laginetako tamainak:

::<math>W_1 \sim N\Big(\mu=\frac{n_1(n_1+n_2+1)}{2},\ \sigma=\sqrt{\frac{n_1n_2(n_1+n_2+1)}{12}}\Big)</math>


Adibidez, <math>n_1=10\,</math> eta <math>n_2=12\,</math> izanik, zer erabaki behar da <math>W_1=145\,</math> suertatu bada?


Aztertu behar da aurretik <math>W_1=145\,</math> ''asko'' edo ''gutxi'' den frogaren norabidea finkatzeko:


::<math>\mu(W_1)=\frac{10 \times 23}{2}=115\,</math>

Beraz, kalkulatu beharreko probabilitatea <math>P(W_1>145)</math> izango da (145 balioa espero zitekeen 115 baino handiagoa delako):

::<math>W_1 \sim N(\mu=115,\ \sigma=15.16) \rightarrow P[W_1>145]=P[Z>(145-115)/15.16]=P[Z>1.98]=0.024</math>

%10eko adierazgarritasun-maila baterako, baztertu behar da homogeneotsuna <math>0.024<0.10/2\,</math> betetzen delako. Ohartu behar da, froga alde bikoa dela eta, beraz, W oso handia zein oso txikia denean baztertu behar dela hipotesi nulua.


== Kanpo loturak ==
== Kanpo loturak ==

08:34, 24 ekaina 2017ko berrikusketa

Estatistikan, Wilcoxonen hein froga aldagai kuantitatibo edo ordinal bati buruzko bi datu-multzo independente populazio berekoak diren erabakitzeko froga estatistiko bat da, homogeneotasun froga bat alegia. Froga ez parametrikoa da, hau da, ez du datuei buruz aurreko eredurik ezartzen, eta aldagaiak eskala ordinal edo kuantitatibo batean neurtuak izatea soilik eskatzen du. Mann-Whitney U frogaren baliokidea da: fi frogen arteko diferentzia bakarra frogarako erabiltzen den estatistikoa da.

Adibide bat

15 urteko mutil eta neska zenbaiti kirol-froga bat egin zaie. Hauek dira lortutako datuak:

Mutilak 13.4 15.6 12.8 14.2
Neskak 14.4 13.6 16.8 18.2 17.4

Neskak eta mutilak populazio berekoak izan eta, beraz, datu-multzo bakar batean har daitezkeen erabaki behar da Wilcoxonen hein frogaren bitartez.

Lehenbizi, datu guztiak batera jartzen dira modu ordenatuan txikienetik handienera, datu bakoitza mutil edo neska bati dagokion zehaztuz, eta datu bakoitzari dagokion heina edo maila ezarriz eta mutilei dagozkien heinak nabarmenduz edo markatuz:

12.8 13.4 13.6 14.2 14.4 15.6 16.8 17.4 18.2
M M N M N M N N N
1 2 3 4 5 6 7 8 9

Frogaren estatistikoa W hein edo mailen batura da:

Hipotesi nulupean bi populazioak berdintzat jotzen dira eta horrela, W bi estatistikoek berdintsuak izateko joera izango dute. Frogarako ohikoa da W' bi estatistikoetatik W0 txikiena hartzea eta, beraz, kontrastea burutzeko W0 txikiena harturik kalkulatu beharreko probabilitatea hau izango da: P[W<W0].

Erabakia hartzeko, Wilcoxonen hein frogarako taulak daude, bi datu-multzoen tamaina ezberdinetarako (n1: lagin handieneko elementu kopurua, n2: lagin txikieneko elementu kopurua):

Wilcoxonen hein frogarako taula
n1 n2 α adierazgarritasun-maila
0.20 0.10 0.05 0.01
3 2 3 (-) (-) (-)
3 3 7 6 (-) (-)
4 2 3 (-) (-) (-)
4 3 7 6 (-) (-)
4 4 13 10 11 (-)
5 2 4 3 (-) (-)
5 3 8 7 6 (-)
5 4 14 12 11 (-)
5 5 20 19 17 15

Adibidean, %10eko adierazgarritasun-maila aukeratzen bada, taulako balio kritikoa 12 da. . Beraz, H0 hipotesi nulua onartu eta neska eta mutilen datuak populazio berekoak izan eta batera jar daitezkeela erabakitzen da.

Bi W estatistikoetatik txikiena aukeratzearen arrazoia bi estatistikoen baliokidetasunean datza: bata emanda, bestea eman daiteke. Bi laginak batera jarrita, eta tamainakoak, hein edo ordena guztien batura izango da:

Kanpo loturak