Doikuntzaren egokitasunerako khi-karratu froga
Estatistikan, doikuntzaren egokitasunerako khi-karratu froga datu multzo baten probabilitate eredu batekiko doikuntzaren egokitasunari buruz erabakitzen duen froga estatistiko bat da, khi-karratu estatistikoan oinarritzen dena. Frogak balio edo balio-tarte bakoitzeko maiztasun enpiriko eta teorikoen arteko aldea hartzen du oinarrittzat, khi-karratu estatistikoaren bitartez, erabakia hartzeko: aldea txikia bada, hipotesi nulua onartu eta eredua datuetara doitasunez egokitzen dela erabaki behar da; aldea handia bada, berriz, probabilitate ereduaren berezko aldakortasunarengantik gertatu ez eta ereduaren egokitzapenaren doitasun ezari dagozkiola erabakitzen da. Khi-karratu estatistikoak kalkulatrzen duen aldearen adierazgarritasuna khi-karratu banakuntzaren bitartez aztertzen da, hipotesi nulupean estatistikoa banakuntza horri jarraiki banatzen baita.
Froga probabilitate eredu jarraitu zein diskretuetarako erabil daiteke. Eredu jarraituetan datuak tartetan biltzen dira maiztasunak eratzeko.
Eduki-taula |
Adibideak [aldatu]
Probabilitate berdintasunerako froga bat [aldatu]
Jogurt berri baterako lau aukera eman zaie dastatzeko 60 bezero potentzialeko talde bati eta lauetatik zein nahiago duten galdetu zaie. A, B, C eta D aukerak nahiago izan dituztenak 20, 14, 12 eta 14 dira, hurrenik hurren. Lau aukerak berdintsuak edo probabilitate berekoak direla baiezta al daiteke %10eko adierazgarritasun-maila batez?
-
-
-
Aukerak Maiztasun enpirikoak: Oi Probabilitatea: pi Maiztasun teorikoak: Ei (Oi-Ei)2/Ei A 20 0.25 0.25×60=15 1.666 B 14 0.25 0.25×60=15 0.066 C 12 0.25 0.25×60=15 0.600 D 14 0.25 0.25×60=15 0.066
-
-
Estatistikoaren emaitza
da, khi-krratu banakuntza bateko 90. pertzentilarekin alderatu behar da, gainetik %10eko probabilitatea (adierazgarritasun maila) utziz, askatasun-maila kopurua 4-1 (4 jogurt edo datu-klase - 1) izanik:
betetzen denez, khi-karratu estatistikoak maiztasun enpiriko eta teorikoen artean duen aldea, probabilitate berdintasuna ezartzen duen hipotesi nulupean, ez da aski handia eta beraz probabilitate berdintasuna onartu egiten da: lau jogurt aukerak neurri berean nahiago direla erabaki behar da.
Eredu diskretu baten egokitasuna [aldatu]
100 egunetan zehar egunero gertatzen den matxura kopurua jaso da:
-
-
-
Matxura kopurua 0 1 2 3 >3 Egun kopurua 21 19 15 20 25
-
-
Eguneko matxura kopurua Poissonen banakuntzari jarraiki gertatzen dela esan al daiteke, adierazgarritasun maila %10 izanik?
Poissonen banakuntzak ezartzen dituen probabilitateak kuantifikatzeko
parametroa zenbatetsi behar da lehenbizi. Ohiko zenbateslea hau da (3 baino handiagoak diren datuen balio adierazgarri gisa 5 balioa hartu da, jatorrizko daturik ezean):
Parametroaren zenbatespen honekin, ereduaren probabilitate zehatzak eman daitezke. Poissonen banakuntzaren probabilitate funtzioa erabiliz:
Probabilitateak kalkulaturik, khi-karratu estatistikoa kalkulatzeari ekiten zaio:
-
-
-
Matxura kopuruak Maiztasun enpirikoak: Oi Probabilitatea: pi Maiztasun teorikoak: Ei (Oi-Ei)2/Ei 0 21 0.096 0.096×100=9.6 13.537 1 19 0.225 0.225×100=22.5 0.544 2 15 0.264 0.264×100=26.4 4.922 3 20 0.205 0.205×100=20.5 0.012 5 25 0.208 0.208×100=20.8 0.848
-
-
Kasu honetan, ereduaren parametro bat datuetatik zenbatetsi denez, erreferentzia gisa hartu beharreko khi-karratu banakuntzak 5-1-1 (5 klase - 1 zenbatespen - 1) askatasun-maila ditu, zenbatespenaren balioaren erabilerak askatasun-maila bat gutxiago uzten baitu: 
betetzen denez, hipotesi nuluak baieztatzen duen Poissonen eredua baztertu behar da eta beraz, datuetarako bestelako probabilitate-eredu bat zehaztu behar da.
Eredu jarrai baten egokitasuna [aldatu]
Eredua jarraia denean, datuak tartetan bildu behar dira.
Ikasle talde bati matematika-test bat proposatu zaie. Izandako puntuazioak hauek dira:
-
-
-
Puntuazioa 0-20 20-40 40-60 60-80 80-100 Ikasleak 2 14 34 38 12
-
-
%10eko adierazgarritasun mailaz datuetara banakuntza normala doi egokitzen den erabaki behar da.
Banakuntza normalaren probabilitateak kalkulatzeko, batezbestekoa eta desbidazio estandarra zenbatetsi behar dira:
Datuek konfirmatu beharreko eredu normal zenbatetsia hau da:
. Eredu honetatik probabilitateak zehaztuko dira.
-
-
-
Puntuazioak Maiztasun enpirikoak: Oi Probabilitatea: pi Maiztasun teorikoak: Ei (Oi-Ei)2/Ei 0-20 2 0.02 0.02×100=2 0 20-40 14 0.14 0.14×100=14 0 40-60 34 0.37 0.37×100=37 0.243 60-80 38 0.34 0.34×100=34 0.470 80-100 12 0.13 0.13×100=13 0.077
-
-
Balio hau 5-2-1=2 askatasun maila dituen khi-karratu banakuntzaren 90. pertzentilarekin alderatu behar da, zenbatespenek bi askatasun-maila kentzen dituztelako:
. Estatistikoaren balioa txikiagoa denez, hipotesi nulua onartu eta beraz, eredu normala egokitzat jotzen da.



![P[X=x]=\frac{e^{-2.34}\times 2.34^x}{x!}](http://upload.wikimedia.org/math/d/0/5/d059dad8a1b970fc8a1fda516b397f97.png)


