Kaxa-diagrama

Wikipedia, Entziklopedia askea
Bi datu multzoen arteko ezberdintasunak erakusten dituzten kaxa eta biboteen diagramak

Estatistikan, kaxa-diagrama, kaxa eta biboteen diagrama ere deitua, ingelesezko box plot izenez ere ezaguna, aldagai koantitatibo bat irudikatzeko datu-diagrama bat da, datu multzo bateko ezaugarriak (zentroa, sakabanatzea, ...) modu integratuan eta grafikoan aztertzen azaltzen dituena. Muturreko datuak atzemateko ere erabiltzen da. Bost laburkin erabiltzen dira bere eraketarako: mediana, lehenengo koartila, hirugarren koartil, datu handiena eta datu txikiena. Aldagai kuantitatibo bati buruz, multzo zenbaiten arteko ezberdintasunak azaltzeko erabiltzen da sarri, horretarako diagramak batera jarriz, bertikalean edo horizontalean. John Tukey estatistikariak garatu zuen 1970eko hamarkadan, berak bultzaturiko datuen azterketa esploratzaile izeneko datuen azterketarako korrontearen baitan. Geroztik maiz erabiltzen da datu estatistikoak aurkezten dituzten txosten eta argitarapen zientifiko eta teknikoetan. Aldi berean, aldaera anitz izan dituen datu-diagrama da: hozkaturiko kaxa-diagrama, bibolin-diagramak eta HDR diagramak, besteak beste.

Interpretazioa[aldatu | aldatu iturburu kodea]

Kaxa-diagramak datuen ezaugarri nagusiak azalarazten ditu.


Kaxa-eta-beso diagramaren bitartez zentroa, sakabanatzea, alborapena eta kurtosia azter daitezke. Datuen azterketa esploratzailearen tresna moduan, kaxa-diagramak muturreko datuen eragina baztertu eta datu multzoaren erdigunean (kaxan, alegia) jasotzen den informazioa lehenesten du datuak aztertzeko, horretarako neurri jasankorrak proposatuz:

  • zentroa kaxa barruko marra bertikalaz adierazten den medianak adieratzen du. Batezbesteko aritmetiko sinplea ez bezala, neurri jasankorra da eta beraz, ez dago muturreko datuen eraginpean.
  • sakabanatze neurri moduan kaxaren zabalera, kuartil arteko ibiltartea alegia, hartzen da. Muturretan dauden datuak ere jaso nahi badira, bibote-muturren arteko distantzia har daiteke sakabanatze-neurri moduan.
  • alborapena aztertzeko, medianatik alde banatara dauden distantziak erkatzen dira, kuartiletaraino edo bikoteen muturretaraino. Eskuineko distantzia (medianatik gora) ezkerreko distantzia (medianatik behera) baino handiagoa bada, banaketak alborapen positiboa duela esaten da; ezkerreko distantzia eskubikoa baino handiagoa bada, berriz, banaketak alborapen negatiboa duela esaten da.
  • kurtosiaren azterketa kaxaren eta biboteen luzera alderatuz egiten da: kaxa zabala bada biboteen aldean, banaketa platikurtikoa edo zapala da; biboteak luzeak badira kaxaren aldean, banaketa leptokurtikoa edo zorrotza da.

Kanpo estekak[aldatu | aldatu iturburu kodea]