Moda (estatistika)

Wikipedia(e)tik
Hona jo: nabigazioa, Bilatu
Ikasgela batean izandako kalifikazioak azaltzen dituen barra-diagrama: moda 6 da, gehien errepikatu den kalifikazioa alegia.

Estatistikan, moda datu-multzo batean gehienetan agertzen den balioa da. Zehatzago, aldagai bakarreko datuetarako (koantitatibo zein koalitatibo), maiztasun handieneko balioa da. Probabilitate banaketa baterako ere kalkula daiteke eta orduan probabilitate handienez agertzen den balioa da.

Batezbestekoa edo mediana bezala, zentro neurri gisa erabiltzen da, datuak balio bakar batez laburbiltzeko.

Modaren kalkulua lagin baterako[aldatu | aldatu iturburu kodea]

Adibidez, (2-2-2-3-3-3-3-4-4) datuak harturik, moda 3 da, gehienetan errepikatzen den balioa baita.

Datu-multzo batean daturik errepikatzen ez denean (1-3-4-6-7 datuetarako, adibidez), moda definituta ez dagoela esaten da. Dena den, egoera hau aldagaiak balio ezberdin asko har ditzakeenean agertzen denez, egokiagoa da kasu hauetan datuak tartetan bildu eta moda maiztasun handiena duen tartean kokatzea, hurbilketa baten bitartez, atal honetan ikusten den bezala.

Datuak maiztasun-taula batean bilduta daudenean, modaren kalkulua berehalakoa da. Adibidez, ikasle hauen adinetarako moda 8 urtekoa da:

Adinak Ikasleak
6 26
7 31
8 43

Aldagai koalitatiboetarako ere kalkula daiteke moda. Adibidez, ikasketa-motari buruzko datu hauetan, modazko kategoria zientziak da:

Aukeratutako ikasketak Ikasleak
Zientziak 20
Letrak 16
Teknologia 12

Modaren kalkulua tartetan bildutako datuetarako[aldatu | aldatu iturburu kodea]

Datuak tartetan bildu direnean, moda maiztasun handiena duen tartean kokatzen da. Tarte-zabalera konstantea bada, era honetan hurbildu daiteke:


Mo=L_i+A\frac{\Delta n_a}{\Delta n_a + \Delta n_o}\ , non


  • Li, moda dagoen tartearen behe-muga den;
  • A, moda dagoen tartearen zabalera den;
  • \Delta n_a, moda dagoen tartearen aurreko tarteko maiztasun absolutua ken moda dagoen tarteko maiztasun absolutua den;
  • \Delta n_o, moda dagoen tartearen ondorengo tarteko maiztasun absolutua ken moda dagoen tarteko maiztasun absolutua den.

Tarte-zabalera ezberdina denean, maiztasunen ordez, (maiztasun absolutu / tarte zabalera) kalkulatu eta erabiltzen dira. Moda azken balio horietan handiena duen tartean kokatuko da eta formulan ere maiztasunen ordez balio horiek erabiliko dira. A moda kokatzen den tartearen zabalera izango da.

Adibidez, herri bateko biztanleen adinari buruzko datuak jaso dira:

Biztanleen adinak Biztanleak
0-20 9
20-40 18
40-60 26
60-80 7
80-100 4

Moda honela kalkulatzen da, moda kokatzen den tartea 40-60 dela kontuan harturik:


Mo=40+20\frac{26-18}{(26-18)+(26-7)}=45.92\ urte\,
Modaren kalkulua tartean bildutako datuetarako. Moda dagoen tartea 40-60 da. Aurreko tarteko maiztasuna handiagoa denez ondorengo tartekoa baino, moda 40tik gertuago kokatuko da 60tik baino, histogramara egokitzen den maiztasun-kurbaren gailurrak erakusten duen bezala. Izan ere, eskubitik maiztasun jeitsiera nabarmenagoa denez, 40-60 tartean, tarte barneko datu-trinkotasuna ezkerretik handiagoa pentsatu eta, beraz, moda 40tik gertuago izango da. Hurbilketa interpolazio linealez egiten da: moda kokatzen den tarteko maiztasuna eta aurreko eta ondorengo tarteetako maiztasunak kontuan harturik hiruki gorriak osatzen dira. Bi hirukiak baliokideak dira eta beraz, oinarriaren (8 eta 19, hurrenez hurren) eta altueraren (h eta 20-h, hurrenez hurren) arteko erlazio berdina dute. Moda kalkulatzeko, h kalkulatu behar da. Hiruko erregela sinple batez, h=5.92 kalkulatu eta beraz Mo=40+h=45.92 izango da.

Moda eta beste zentro-neurriak[aldatu | aldatu iturburu kodea]

Modak, medianak eta batezbesteko aritmetiko sinpleak oso emaitza ezberdinak eman ditzakete, denak zentro-neurri badira ere:

Zentro neurriak alderatuz
Izena Deskribapena Formula Adibidea Emaitza
Batezbesteko aritmetiko sinplea Datuen batura zati datu kopurua. \scriptstyle\bar{x} = \frac{1}{n}\sum_{i=1}^n x_i  =  \frac{1}{n} (x_1+\cdots+x_n) (1+2+2+3+4+7+9) / 7 4
Mediana Datuak ordenaturik, erdian dagoen datua. 1, 2, 2, 3, 4, 7, 9 3
Moda Datuetan gehien errepikatzen den balioa. 1, 2, 2, 3, 4, 7, 9 2

(1, 2, 2, 3, 4, 7, 9) datu hauetarako zentro-neurri adierazgarriena edo zentroa hobekien islatzen duena mediana edo batezbesteko aritmetiko sinplea da, nekez esan baitaiteke datuak modak ematen duen 2 balioaren inguruan biltzen direla.

Oro har, moda, mediana eta beztesbesteko aritmetiko sinplea alborapen handiko banakuntzetan izango dira nahiko ezberdinak.

Modaren beste eragozpen bat hau da: moda anitza ere izan daiteke, gehienetan errepikatzen diren balioak zehazteko orduan berdinketa dagoenean.

Moda probabilitate banakuntzetan[aldatu | aldatu iturburu kodea]

Probabilitate banaketa diskretua bada (banaketa binomiala, esaterako), moda probabilitate handieneko balioa izango da. Banakuntza jarraietan, probabilitate trinkotasuna handien egiten duen balioa izango da, trinkotasun funtzioan maximoa ematen duen balioa alegia. Egoera bitxi bat banaketa uniformean gertatzen da, non balio guztiak probabilitate berekoak diren.