Khi-karratu estatistiko

Wikipedia(e)tik
Hona jo: nabigazioa, Bilatu
Artikulu hau estatistikoari buruzkoa da; beste esanahietarako, ikus «Khi-karratu».

Estatistikan, khi-karratu estatistikoa (\Chi^2 irudikatzen dena, alfabeto grekoko khi letra maiuskula erabiliz, 2 goi-indizeaz) erabilera anitz duen estatistikoa da: egokitzapenaren doitasunaren azterketan, probabilitate teoriko multzo batetik errealitatean jasotako maiztasunak neurri adierazgarri batez urruntzen diren erabakitzeko alegia, kontingentzia-taula batean aldagai kualitatiboen arteko erlazioa neurtu eta taulako bi aldagaien artean independentzia dagoen aztertzeko eta beste hainbat froga estatistikoetan. Khi-karratu izena estatistikoaren lagin banaketa khi-karratu banaketari jarraiki banatzen delako esleitu zaio.

Kontingentzia-tauletarako khi-karratu[aldatu | aldatu iturburu kodea]

Kontingentzia taulak aztertzen direnean, khi-karratu estatistikoa bi aldagairen artean independentzia dagoen erabakitzeko erabiltzen da, independentziarako khi-karratu frogaren bitartez. Asoziazio neurriak eratzeko ere erabiltzen da.

\Chi^2=\sum_i\frac{(O_i-E_i)^2}{E_i},

non O_i behatutako maiztasunak edo maiztasun enpirikoak eta E_i itxarondako maiztasunak edo maiztasun teorikoak diren.

O_i maiztasun enpirikoak gelaxka ezberdinetako maiztasunak absolutuak dira, guztirako eta bazter maiztasunak ezik.

E_i maiztasun teorikoak bi aldagaien artean erabateko independentzia balitz, izango liratekeen maiztasun absolutuak dira. Honela kalkulatzen dira gelaxka bakoitzeko: gelaxkari dagozkion bi bazter maiztasunak, bere zutabeko eta errenkadako baturak alegia, biderkatu eta guztirako datu kopuruaz zatitu egiten da.

Khi-karratu kalkulatzeko, nahikoa da taulako gelaxka guztietarako, \frac{(O_i-E_i)^2}{E_i} kalkulatu eta emaitzen batuketa kalkulatzea. Khi-karratu estatistikoa zenbat eta handiagoa, orduan eta handiagoa izango da bi aldagaien arteko dependentzia, maiztasun teoriko eta enprikoen arteko aldea orduan eta handiagoa izango baita.

Adibidez, ikasle batzuen gainean sexua eta azterketa bat gainditu duten jaso da. Kontingentzia taula honetan azaltzen dira datuak bildurik:

gainditu ez gainditu GUZTIZKO
gizon 43 29 72
emakume 44 14 58
GUZTIZKO 87 43 130

Aurreko maiztasunak maiztasun enpirikoak edo behatutako maiztasunak dira. Jarraian, maiztasun teorikoak edo itxarondako maiztasunak nola kalkulatzen diren azaltzen da:

gainditu ez gainditu GUZTIZKO
gizon \frac{72 \times 87}{130}=48.18 \frac{72 \times 43}{130}=23.82 72
emakume \frac{58 \times 87}{130}=38.82 \frac{58 \times 43}{130}=19.18 58
GUZTIZKO 87 43 130

Ondoren, gelaska bakoitzeko \frac{(O_i-E_i)^2}{E_i} kalkulatu behar da:

gainditu ez gainditu
gizon \frac{(43-48.18)^2}{48.18}=0.56 \frac{(29-23.82)^2}{23.82}=1.13
emakume \frac{(44-38.82)^2}{38.82}=0.69 \frac{(14-19.18)^2}{19.18}=1.40

Gelaska hauetako zenbatekoen batura izango khi-karratu estatistikoa:

\Chi^2=0.56+1.13+0.69+1.40=3.78

2x2 tauletarako adierazpen berezia badago khi-karratu estatistikorako:

  S T
X a b
Y c d


\Chi^2=\frac{(ad-bc)^2 (a+b+c+d)}{(a+d)(c+d)(b+d)(a+c)},

Khi-karratu zenbat eta handiagoa (hau maiztasun teorikoak eta enpirikoak oso ezberdinak direnean izango da) aldagaiak independenteak izateko aukerak orduan eta txikiagoak izango dira. Khi-karratu estatistikoaren balioa independentzia ukatzeko aski handia edo adierazgarria den erabakitzeko, independentziarako khi-karratu froga burutu beharko da.

Doikuntzaren egokitasunerako khi-karratu[aldatu | aldatu iturburu kodea]

Egokitzapenaren doitasuna aztertzeko ere erabil daiteke khi-karratu estatistikoa, egokitzapenaren doitasunerako khi-karratu frogaren bitartez, zorizko eredu estatistiko bat edo probabilitate-banaketa bat jasotako datuetara egokitzen den erabakitzeko. Kasu honetan, khi-karratu modu berean kalkulatzen da:

\Chi^2=\sum_i\frac{(O_i-E_i)^2}{E_i},

baina oraingo honetan, maiztasun teorikoak probabilitate banaketak balio bakoitzari esleitzen dion probabilitateei dagokien maiztasunak dira. Adibidez, eredu batek 2 balioari 0.3 probabilitatea ezarri badio eta guztira 100 datu jaso dira, maiztasun teorikoa 100×0.3=30 litzateke datuak eredura erabat egokitzen badira. Maiztasun enpirikoa, kasu honetan, 2 datua zenbat aldiz agertzen litzateke. Aldagai batek balio ezberdin asko hartzen dituenean, aldagai jarraituen kasuan alegia, datuak tartetan biltzen dira kalkulurako.

Adibidez, dado bat botatzean lortutako puntuek dadoa orekatua den erakusten den erabaki nahian, dadoa 60 aldiz jaurti eta egokitzapenaren doitasunerako khi-karratu froga garatzean honela kalkulatuko litzateke khi-karratu estatistikoa:

Puntuak Probabilitatea: pi Aldi kopurua: Oi Maiztasun teorikoak: Ei (Oi-Ei)2/Ei
1 1/6 14 (1/6)×60=10 1.6
2 1/6 8 (1/6)×60=10 0.4
3 1/6 5 (1/6)×60=10 2.5
4 1/6 11 (1/6)×60=10 0.1
5 1/6 7 (1/6)×60=10 0.9
6 1/6 15 (1/6)×60=10 2.5
\Chi^2=\sum_i\frac{(O_i-E_i)^2}{E_i}=1.6+0.4+2.5+0.1+0.9+2.5=8

Yatesen jarraitutasun zuzenketa[aldatu | aldatu iturburu kodea]

2x2 kontingentzia taula baterako gomendatzen den zuzenketa da, khi-karratu estatistikoa kalkulatzerakoan, gelaxkaren baten maiztasun teorikoa 5etik beherakoa denean:

 \Chi_\mathrm{Yates}^2 = \sum_{i=1}^{N} {(|O_i - E_i| - 0.5)^2 \over E_i}

Iturri batzuk gelaxkaren baten maiztasun teorikoa 10 baino txikiagoa denean erabili behar dela diote eta beste batzuk beti erabili behar dela. Dena den, gelaxketako maiztasunak handiak direnean, bere efektua oso txikia da.

Zuzenketa hau Frank Yates estatistikari ingelesak proposatu zuen 1934. urtean.

Ikus, gainera[aldatu | aldatu iturburu kodea]