Sakabanatze (estatistika)
Estatistikan, sakabanatzea edo dispertsioa aldagai bakarreko datu multzo edo probabilitate banakuntza baten aldakortasun edo heterogeneotasuna aztertzen duen ezaugarria da. Adibidez, A:(1,4,7) eta B(3,4,5) datu multzoak harturik, A datu multzoa sakabanatuagoa dela esango da, tarte handiago batean zehar zabaldu eta datuak gehiago aldentzen direlako 4 balioa hartzen duen batezbestekotik. Probabilitate teorian, ziurgabetasunaren neurri moduan erabiltzen da maiz.
Estatistikan gehien aztertzen den ezaugarri bat da, zentralizazioarekin batera, datuen zentroa ez baita nahikoa izaten datu multzoak bereizteko. Zentroaren eta sakabanatzearen zenbatespenak, berriz, aski izaten dira egoera askotan datu-multzoak eta probabilitate-banakuntzak zehaztu eta finkatzeko, banakuntza normalaren kasuan esaterako. Horretaz gainera, sakabanatze neurriak batezbesteko baten fidagarritasun edo adierazgarritasuna zehazteko, aldagaiak kontrolatzeko (adibidez, lantoki bateko ekoizpen-datuak ohiko mugetatik aldentzen ari ote diren aztertzeko), datu multzoak eta probabilitate banakuntzak alderatzeko eta beste neurri estatistiko batzuk eratzeko erabiltzen dira. Muturreko datuak hauteman eta estandarizazio izeneko eragiketaz datu multzo ezberdinetako datuak alderatzeko ere erabiltzen dira.
Gehienetan, sakabanatzea aldagai kuantitatiboei buruzkoa da, baina aldagai kualitatiboen sakabanatzea ere azter daiteke, beste ikuspuntu batetik bada ere. Nolanahi ere, sakabanatzea kontzeptu abstraktua da, hedapena, zabalera, aldakortasun eta desbideratze moduan interpretatzen dena. Horregatik, anitz dira sakabanatzea neurtzeko proposatu diren neurriak. Bi sailetan banatzen dira: sakabanatze neurri absolutuak, datu multzo eta probabilitate banakuntza bakar baten aldakortasuna neurtzeko baliatzen direnak, eta sakabanatze neurri erlatiboak, bi datu multzo alderatzeko erabiltzeko egokiak.
Sakabanatze neurriak: distantzia neurriak eta batezbesteko desbideratze neurriak [aldatu]
Sakabanatze neurri bat eratzeko bi modu daude funtsean:
- distantzia-neurri batean bi datu edo gehiagoren arteko distantzia edo aldea kalkulatzen da (adibidez, datu handiena ken datu txikiena);
- batezbesteko desbideratze-neurri batean, datu guztiak harturik, balio zehatz eta finko batera duten desbideratzeen batezbesteko bat kalkulatzen da.
Distantzia-neurrien abantaila nagusia kalkulurako erraztasuna da, baina eragozpen moduan ez dute jasotzen datu guztietan biltzen den informazioa. Batezbesteko desbideratze-neurri batean kontuan datu guztiak hartzen badira ere, kalkulua konplexuagoa da.
|
Distantzia-neurriak |
Batez besteko desbideratze-neurriak |
Sakabanatze neurri absolutuak eta erlatiboak [aldatu]
Sakabanatze neurri absolutuak eta erlatiboak ere bereizten dira. Sakabanatze neurri absolutuak datu multzo baten baitan dagoen aldakortasun maila absolutua neurtzen dute, aldagaiaren unitatetan. Sakabanatzea neurtzen duten jatorriko neurriak dira, distantzian eta batez besteko desbideratzean oinarritzen direnak. Ezin dira, ordea, erabili, datu multzo ezberdinetako sakabanatzeak alderatzeko, batezbesteko edo erreferentzia ezberdinei buruz kalkulatu direlako.
Oztopo hau gainditu eta horrela datu multzoen arteko sakabanatze-mailak alderatu ahal izateko sakabanatze-neurri erlatiboak erabiltzen dira, horretarako dimentsio edo unitaterik gabeko koefizienteak erabiliz eta sakabanatze-neurri absolutua dagokion zentro-neurriarekin alderatuz askotan (ikus, esaterako, ibiltarte-erdia eta desbideratze estandarra, hurrengo taulan). Adibidez, bariedade bateko tomate aleen pisuak jasotzen dituen datu-multzo baten baitan batezbesteko desbideratze-neurri bat 100 gramukoa bada, batezbestekoa 300 gramukoa izanik, eta beste bariedade batean desbideratze-neurria 100 gramukoa bada, baina 500 gramuko batezbesteko baten inguruan, bigarren kasuan sakabanatzea erlatiboki txikiagoa da: 100/300=%33.3koa lehen kasuan eta 100/500=%20koa bigarrenean. Konparazio erlatiboa datuak unitate ezberdinetan jasota dauden kasuetarako ere baliagarria da, sakabanatze-neurri erlatiboek ez baitute unitaterik eta orohar portzentaje baten bitartez adieraz daitezkeelako.
Sakabanatze-neurri absolutuak kasu bakar batean erabil daitezke bi datu-multzoen arteko sakabanatze-mailak alderatzeko: batezbesteko berdina eta unitate berdinetan dutenean.
-
Neurri absolutua Formula Dagokion neurri erlatiboa Formula Ibiltartea 
Ibiltarte-koefizientea 
Ibiltarte erlatiboa 
Ibiltarte-erdia 
Ibiltarte-koefizientea 
Kuartil arteko ibiltartea 
Kuartilen aldakortasun koefizientea 
Kuartilen desbideratzea 
Kuartilen aldakortasun koefizientea 
Batez besteko desbideratze absolutua 
Desbideratze absolutuaren koefizientea 
Desbideratze estandarra 
Aldakortasun-koefizientea 
Desbideratze absolutuen mediana 
Desbideratze absolutuen medianaren koefizientea 
Batez besteko diferentzia (Gini) 
Batez besteko diferentzia erlatiboa 
















