P balioa
Estatistikan orokorrean eta hipotesi-probetan, p-balioa (p, p-balioa, jakinarazitako p-balioa edo zuzenean ingelesez p-balioa izenez ere ezagutzen dena) definitzen da: egiazko hipotesi nulu bat emanda kalkulatutako balio estatistiko bat posible izateko probabilitate bezala. Termino sinpleetan, p balioak ausazko laginketaren emaitzak estatistikoki esanguratsuak direnetatik bereizten laguntzen du.
p-balioaren beste definizio are zehatzagoa izango litzateke: Ikerketaren emaitzak behatzeko probabilitatea (edo hipotesi nulutik urrunago dauden beste batzuk) hipotesi nulua egia balitz.
p -balioak, arbitrarioki ezarritako esangura-maila baino txikiagoa izatearen baldintza betetzen badu, emaitza, estatistikoki, esanguratsutzat hartzen da, eta, beraz, hipotesi nulua baztertzeko aukera ematen du.
Ezinbestekoa da p balioa hipotesi nulu bat (edo hasierako hipotesi) egiazkoa den suposizioan oinarritzen dela indartzea. p balioa, beraz, esangura estatistikoaren neurria da.
Interpretazioa
[aldatu | aldatu iturburu kodea]p balioa probabilitate-balioa da; beraz, 0tik 1erako bitartekoa da. p balioak H0 hipotesi nulua egiazkoa dela suposatuz lortu dugun emaitza lortu izanaren probabilitatea erakusten digu. Esan ohi da p-ren balio handiek ez dutela H0 baztertzen uzten, p-ren balio baxuek H0 baztertzea ahalbidetzen duten bitartean.
Proba estatistiko batean, H0 hipotesi nulua baztertzen da ikusitako emaitzari lotutako p balioa arbitrarioki ezarritako baino esangura-mailaren berdina edo txikiagoa bada, konbentzionalki 0,05 edo 0,01. Beste era batera esanda, lortutako emaitza, espero den emaitzen sorta emandako H0 benetako hipotesi nulua eta esangura maila aukeratua baino ezohikoagoa bada, hau da, p baino txikiagoa bada, esan dezakegu, estatistikoki, esanguratsua den emaitza dugula, H0 baztertzeko aukera ematen diguna.
Garrantzitsua da azpimarratzea hipotesi-test batek ez duela hipotesirik onartzen; besterik gabe arbuiatzen du, edo ez du baztertzen; hau da, sinesgarritzat edo sinesgaitz gisa jotzen du; horrek ez du zertan esan nahi egia denik, baizik eta litekeena dela, besterik gabe.
Ezohiko erroreen abisua
[aldatu | aldatu iturburu kodea]p balioa esangura-maila baino txikiagoa bada ere, baliteke hasierako hipotesia faltsua izatea; baliteke baita behaketa atipiko baten aurrean egotea ere. Hori dela eta, egia denean hipotesi nulua baztertuz, errore estatistikoa egiteko zorian egongo ginateke, oinarritzat hartuta ohiz kanpoko behaketa aurkitzean zorte txarra izan dugula. Akats mota hori zorrotzagoa izanda eta espero den p balio maximoa jaitsiz zuzendu daiteke; 0,05eko ohiko ikerketa soziologikoetan erabiltzen da, 0,01 baino txikiagoa den ikerketa medikotan erabiltzen den bitartean, non akats bat egiteak ondorio larriagoak ekar ditzakeen. Era berean, lortutako laginaren tamaina handituz, akats hori zuzentzen saiatzea posible da, lortutako datuak kasualitatez arraroak izateko aukera murrizten baitu.
Adibideak
[aldatu | aldatu iturburu kodea]Adibideak txanponekin
[aldatu | aldatu iturburu kodea]Esperimentu estatistiko bat egin daiteke txanpon bat bidezkoa (hau da, burua edo isatsa gainean lurreratzeko probabilitatea berdina den) edo bidegabea den (hau da, txanpona bi emaitzetako bat bestea baino maizago eman dadin antolatuta dagoen). Demagun txanpon bat 20 aldiz jarraian botatzen dugula airera, eta emaitza esperimentalek erakusten dute txanponak 20 jaurtiketetatik 14 aldiz buru ateratzen dela. Txanpona bidezkoa ala bidegabea da?
Hori zehazteko, hipotesi nulu gisa definitzen dugu: txanpona bidezkoa da, eta proba estatistiko gisa buruen kopurua. 20 aldiz jaurtiz gero, txanpon justu batek, gutxienez, 14 buru ateratzeko duen probabilitatea da esperimentu horren p -balioa. Probabilitate hori koefiziente binomialak erabiliz kalkula daiteke honela[1]:
0,058ko probabilitate hori da p-balioa, buruaren aldeko muturreko emaitzak soilik kontuan hartuta eta alde bakarreko proba bat aplikatuz lortua. Hala ere, txanpon batean, desbideratzeak buruei edo isatsei egin diezaieke mesede. Horretarako, bi aldeetako proba bat erabiltzen dugu, bi noranzkoetan izan daitekeen desbideratzea kontuan hartzen duena. Txanpon justuak, banaketa binomial simetrikoa duenez, bi aldeetako p-balioa alde bakarreko p-balioaren bikoitza baino ez da. Hau da, 0,115[2].
Modu honetan, daukaguna da:
- Hipotesi nulua (H0): txanpona bidezkoa da, Prob(burua) 0,5ekin.
- Proba estatistikoa: buru kopurua.
- O behaketa: 14 buru 20 jaurtiketetan.
- esangura-maila, arbitrarioki aukeratutakoa: 0,05
- O behaketarako emandako bi aldeetako p-balioa H0: 0,115.
Horrela, kalkulatutako p-balioa, 0,115, aukeratutako 0,05 esangura-maila baino handiagoa da. Horrek esan nahi du 20 jaurtiketatik 14 bururen emaitza ez dela sinesgaitza txanpon justu batentzat, emaitza hori esperimentua txanpon batekin errepikatzen den kasuen % 95 aldiz lortuko litzatekeen emaitzen tartean dagoela. Horregatik, hipotesi nulua ez da baztertzen; hau da, txanpona bidezkoa dela suposatzen dugu.
Kontuan izan, buru bat gehiago lortuko balitz, hau da, 20 jaurtiketetan 15 buru, ondoriozko (bi aldeetako) p-balioa 0,0414 (% 4,14) izango litzatekeela; kasu horretan, hipotesi nulua baztertu beharko litzateke aukeratutako 0,05eko esangura-mailarako; hau da, kasu horretan, txanpona bidegabea dela suposatuko genuke.
Eguneroko egoeraren adibidea
[aldatu | aldatu iturburu kodea]Demagun bi lagun taberna batean daudela eta batek besteari esaten diola whiski merkea garestitik bereiz dezakeela. Beste lagunak sinesten ez dionez, proba bat egitea erabakitzen dute. Bully lagunak dio, gutxienez, % 90 alditan zein whiski-mota edaten duen asmatzen duela, gainerakoetan izotzak bere dastamena desitxuratzen duelako. 20 whiski dastatzea erabakitzen dute (gau ezberdinetan), eta, 14 gauetan, dastatu duen edalontziaren edukiari buruz arrazoia duela ikusiko dute.
Gure lagunak arrazoia % 90 alditan izango zuela esan zuenez eta % 70 alditan bakarrik (20 gauetik 14) asmatu duenez, gure lagunari sinetsi diezaiokegu ala engainatzen ari zaigu? Posible da zorte txarragatik huts egin izana, baina, epe luzera, saiatzen jarraitzen uzten badiogu % 90 lortuko du, ezta? Garbi dago gauero arrazoia izan balu edo haietako 19tan asmatu izan balu dudarik gabe sinetsiko geniokeela; gainera, denak, edo ia denak, huts egin izan balu, iruzur egiten ari zitzaigula jakingo genuke, baina 20tik 14rekin pixka bat dudako da. Hori da p-ren balioarekin neur dezakeguna.
Hipotesi nulua egia dela suposatzen badugu, hau da, gure lagunaren gustuak 0,90 parametroa duen binomio baten arabera banatzen direla, % 90 buru eta % 10 buztan ateratzen den txanpon baten antzera, zein da 20 aldiz errepikatutako 0.9 parametroko banaketa binomial batek 14 buru eta 6 buztan emateko probabilitatea? Probabilitate hori kalkulatuz, p = 0,008867 ≃ % 0,89 geratzen zaigu. Balio horri zuzena izateko probabilitatea 13 aldiz bakarrik gehitzen badiogu, gehi zuzena izateko probabilitatea 12 aldiz bakarrik eta horrela batere zuzena ez izateko probabilitateraino, hau da, 14 aldiz edo gutxiago izateko probabilitatea, horrek p = 0,011253 ≃ % 1,13 ematen digu. Hori da p-ren balioa.
Horrek zer esan nahi du? Bada, esan nahi duena da benetan suposatzen badugu gure lagunak trago bat dastatzen duen aldioro % 90 asmatzen duela eta 20 trago dastatu dituela, 15 aldiz baino gutxiagotan asmatzeko probabilitatea % 1,13 dela. Hau da, 0,05eko esangura-maila ohiko bezala aukeratzen badugu (zeinak esan nahi duen oker egoteak % 5 alditan onartzen dugula esperimentua errepikatzen badugu) eta p -ren balioa esangura-maila baino txikiagoa denez, hipotesi nulua baztertuko dugu, eta gure laguna harroputza dela esango dugu. Hori egiten dugu ikusitako emaitza (20 entsegutik 14 asmatu), estatistikoki, oso zaila delako % 90 zuzena dela suposatzen badugu; beraz, hipotesi nulua ez zela egiazkoa suposatzen dugu.
Zer gertatuko zen 20 aldiz asmatu izan balu? Kasu horretan, p-ren balioa oso altua izango litzateke, oso litekeena baita 0,90 parametroa 20 aldiz errepikatzen den banaketa binomial batek 20 ematea. Beraz, ez genuke hipotesi nulua baztertuko. Hau da, esango genuke % 90 zuzena izatea sinesgarria dela; baliteke arrazoia izatea; ez dugu horren kontrako froga esanguratsurik p-ren balioa oso aldekoa izan baitzaigu.
p-ren balioa da hipotesi nuluak proposatzen duen populaziotik behatutako lagina edo are urrunagoko bat lortzeko probabilitatea. p-ren balioa I motako errorearen probabilitatearekin erlazionatuta dago.