Kaxa-diagrama

Wikipedia(e)tik
Hona jo: nabigazioa, Bilatu
Bi datu multzoen arteko ezberdintasunak erakusten dituzten kaxa eta biboteen diagramak

Estatistikan, kaxa-diagrama, kaxa eta biboteen diagrama ere deitua, ingelesezko box plot izenez ere ezaguna, aldagai koantitatibo bat irudikatzeko datu-diagrama bat da, datu multzo bateko ezaugarriak (zentroa, sakabanatzea, ...) modu integratuan eta grafikoan aztertzen azaltzen dituena. Muturreko datuak atzemateko ere erabiltzen da. Bost laburkin erabiltzen dira bere eraketarako: mediana, lehenengo koartila, hirugarren koartil, datu handiena eta datu txikiena. Aldagai kuantitatibo bati buruz, multzo zenbaiten arteko ezberdintasunak azaltzeko erabiltzen da sarri, horretarako diagramak batera jarriz, bertikalean edo horizontalean. John Tukey estatistikariak garatu zuen 1970eko hamarkadan, berak bultzaturiko datuen azterketa esploratzaile izeneko datuen azterketarako korrontearen baitan. Geroztik maiz erabiltzen da datu estatistikoak aurkezten dituzten txosten eta argitarapen zientifiko eta teknikoetan. Aldi berean, aldaera anitz izan dituen datu-diagrama da: hozkaturiko kaxa-diagrama, bibolin-diagramak eta HDR diagramak, besteak beste.

Eraketa[aldatu | aldatu iturburu kodea]

Kaxa-diagramaren bertsio arruntenerako pauso hauek jarraitu behar dira, diagrama horizontalean marraztu nahi bada:

  1. Lehenengo eta hirugarren kuartilak eta mediana kalkulatu behar dira.
  2. Kuartil arteko ibiltartea kalkulatu behar da: hirugarren koartila ken lehenengo koartila.
  3. Laukizuzen bat, kaxa alegia, marraztu behar da, ezkerretik lehenengo koartila eta eskuinetik hirugarren koartila mugatzat dituena.
  4. Mediana goitik beherako marra batez irudikatzen da kaxa barnean.
  5. Kaxako alde banatik, lehenengo eta hirugarren kuartiletatik alegia, biboteak luzatzen dira, marra batez, 1.5 bider kaxa edo kuartil arteko ibiltartearen luzeran.
  6. Biboteen muturretatik harago dauden datuak muturreko datutzat hartzen dira eta puntu banaz adierazten dira.
  7. Biboteak haien luzeran zehar dauden albo balioetan, datu txikien eta handienaren balioetan alegia, moztu behar dira, muturreko datuak egon ala ez.

Adibidea[aldatu | aldatu iturburu kodea]

10 ikasleko gela batean kalifikazio hauek jaso dira:

0.2 - 3.4 - 4.1 - 4.2 -5 - 5.4 - 5.6 - 6 - 6.3 - 6.5 - 8.1 - 9.2
Kalkulua Emaitza Esanahia
Mediana Me=5.5 Datu ordenatuen erdian dagoen balioa.
Lehenengo kuartila Q_1=4.1 Balio honen azpitik datuen %25ak daude.
Hirugarren kuartila Q_3=6.3 Balio honen gainetik datuen %25ak daude (eta azpitik %75ak).
Kuartil arteko ibiltartea Q_3-Q_1=2.2 Lehenengo kuatiletik hirugarren kuartilera datuen %50ak daude.
Goi bibotea (luzea) Q_3+1.5(Q_3-Q_1)=9.6 Goi biboteaz haraindiko muturreko daturik ez dago.
Goiko albo-balioa eta goi bibotea (moztuta) albo\ balioa=9.2 Bibotea 9.2 puntuan moztu behar da.
Behe bibotea (luzea) Q_1-1.5(Q_3-Q_1)=0.7 Behe biboteaz haraindiko muturreko datu bat badago: 0.2.
Beheko albo-balioa eta behe bibotea (moztuta) albo\ balioa=3.4 Bibotea 3.4 puntuan moztu behar da.
Kaxa lehenengo eta hirugarren kuatilek mugatzen dute eta horien artean mediana kokatzen da marra batez adierazita. Kuartiletatik bibote bana luzatzen da, 1.5 bider kuartil arteko ibiltartearen luzeran dauden azken datuen balioetaraino. Haraindi dauden datuak muturreko datuak dira.

Interpretazioa[aldatu | aldatu iturburu kodea]

Kaxa-diagramak datuen ezaugarri nagusiak azalarazten ditu.


Kaxa-eta-beso diagramaren bitartez zentroa, sakabanatzea, alborapena eta kurtosia azter daitezke. Datuen azterketa esploratzailearen tresna moduan, kaxa-diagramak muturreko datuen eragina baztertu eta datu multzoaren erdigunean (kaxan, alegia) jasotzen den informazioa lehenesten du datuak aztertzeko, horretarako neurri jasankorrak proposatuz:

  • zentroa kaxa barruko marra bertikalaz adierazten den medianak adieratzen du. Batezbesteko aritmetiko sinplea ez bezala, neurri jasankorra da eta beraz, ez dago muturreko datuen eraginpean.
  • sakabanatze neurri moduan kaxaren zabalera, kuartil arteko ibiltartea alegia, hartzen da. Muturretan dauden datuak ere jaso nahi badira, bibote-muturren arteko distantzia har daiteke sakabanatze-neurri moduan.
  • alborapena aztertzeko, medianatik alde banatara dauden distantziak erkatzen dira, kuartiletaraino edo bikoteen muturretaraino. Eskuineko distantzia (medianatik gora) ezkerreko distantzia (medianatik behera) baino handiagoa bada, banaketak alborapen positiboa duela esaten da; ezkerreko distantzia eskubikoa baino handiagoa bada, berriz, banaketak alborapen negatiboa duela esaten da.
  • kurtosiaren azterketa kaxaren eta biboteen luzera alderatuz egiten da: kaxa zabala bada biboteen aldean, banaketa platikurtikoa edo zapala da; biboteak luzeak badira kaxaren aldean, banaketa leptokurtikoa edo zorrotza da.

Kanpo loturak[aldatu | aldatu iturburu kodea]

Commonsen badira fitxategi gehiago, gai hau dutenak: Kaxa-diagrama Aldatu lotura Wikidatan