Goodman eta Kruskalen tau

Wikipedia, Entziklopedia askea

Estatistikan, Goodman eta Kruskalen tau, τ hizki grekoaz irudikatzen dena, kontingentzia taula bateko bi atributu edo aldagai kualitatibo artean dagoen asoziazio edo loturaren sendotasunerako neurria da. Aldagai kuantitatiboetarako ere eman daiteke, dagozkion datuak kontingentzia taula batean ezarri badira. Aurreikuspen errorearen murrizketan oinarritzen den asoziazio neurrietako bat da.

Kalkulua[aldatu | aldatu iturburu kodea]

Tau kalkulatzeko, bi aldagaietako bat aldagai independentetzat eta bestea mendeko aldagaitzat hartu ondoren, mendeko aldagaia aurreikusteko bi erregela erabiltzen dira. Lehenengo erregelan ez da aldagai independenteari buruzko informazioa erabiltzen. Bigarren erregelan mendeko aldagaiari buruzko aurreikuspenak aldagai independenteko kategoria kontuan hartuz egiten da. Lehenengo erregelatik bigarren erregela pasatzean lortzen den errore murrizketaren ehunekoa da tau.

Adibidea[aldatu | aldatu iturburu kodea]

Sexuari eta aukeratutako ikasketa motari buruzko inkesta bateko datuekin, kontingentzia taula hau eratu da:

Aukeratutako ikasketa mota eta sexua
Aukeratutako ikasketa mota Guztira
Letrak Zientziak Osasuna
Sexua Gizonezko 20 140 80 240
Emakumezko 10 100 120 230
Guztira 30 240 200 470

Lojikoa den bezala, aldagai independentetzat sexua hartuz, matematika frogako emaitzari buruzko aurreikuspenak egin behar dira.

Lehenengo erregelaz sortutako erroreak

Ikasketa mota letrak izango dela aurreikustean sortutako erroreak hauek dira:

Ikasketa mota zientziak izango dela aurreikustean sortutako erroreak hauek dira:

Ikasketa mota osasuna izango dela aurreikustean sortutako erroreak hauek dira:

Lehenengo erregelaz, beraz, 28.09+117.45+114.89=260.43 errore sortzen dira aukeratutako ikasketa mota aurreikusteko orduan. Aurreikuspen erregelaren funtsa azaltzen da jarraian: 470 aurreikuspen ezberdin egin behar dira; aldagai independentea den sexua ezagutu gabe, ezaguna da 30, 240 eta 200 ikasle daudela, hurrenez hurren letrak, zientziak eta osasuna hurrenez hurren aukeratu dutenak; horrenbestez, letrak aukeratu duten ikasleetarako, (30/470) probabilitateaz, zozketa batez, erabakiko da ikasleak letrak hartu dituela; oker erabakitzeko probabilitatea beraz, (440/470) izango da; 30 ikasle direnez letrak aukeratu dituztenak, ikasle hauetarako egindako okerren itxaropen matematikoa, sortutako errore kopurua alegia, (440/470)x30=28.09 izango da.

Bigarren erregelaz sortutako erroreak

Bigarren erregelaz sortutako erroreak modu berean kalkulatzen dira, baina bazter maiztasunak hartu ordez, aldagai independentearen kategoriaz kategoria, lerroz lerro, joan behar da.

Honela, aurreikuspena egiteko aukeratu den pertsona gizonezkoa dela jakinez gero, sortutako lerroak hauek dira, arestian bezala kalkulatuz:

Horrela, aukeratutako pertsona gizonezkoa dela jakinda, sortutako erroreen kopurua hau da: 18.33+58.33+53.33=129.

Aukeratutako pertsona emakumezkoa dela jakinda, era berean kalkulatzen dira sortutako erroreen kopurua ikasketa motari buruz aurreikustean:

Beraz, aukeratutako pertsona emakumezkoa dela jakinda, guztira 9.56+56.52+57.39=123.47 errore sortzen dira.

Horrenbestez, bi sexuetarako 129+123.47=252.47 errore sortzen dira. Hau da, lehenengo erregelaz sortutako erroreekin alderatuz, 260.43-252.47=7.96 errore gutxiago. Beraz, Goodman eta Kruskalen tau (7.96/260.43)x100=%3 izango da.

Interpretazioa[aldatu | aldatu iturburu kodea]

Tau zenbat eta handiagoa izan, atributuen arteko asoziazioa orduan eta sendoagoa izango da. Eskuarki, emaitza %60tik gorakoa denean, asoziazio maila sendoa dela esan daiteke, nahiz eta antzeko ikerketak ere kontuan hartu behar diren, asoziazio mailari buruz azken erabaki bat hartzeko.

Kanpo estekak[aldatu | aldatu iturburu kodea]