Kaxa-diagrama: berrikuspenen arteko aldeak

Wikipedia, Entziklopedia askea
Ezabatutako edukia Gehitutako edukia
Joxemai (eztabaida | ekarpenak)
No edit summary
Joxemai (eztabaida | ekarpenak)
No edit summary
1. lerroa: 1. lerroa:
[[Fitxategi:Boxplot 0001.png|thumb|right|250px|Bi datu multzoen arteko ezberdintasunak erakusten dituzten '''kaxa-eta-beso diagramak''']]
[[Fitxategi:Boxplot 0001.png|thumb|right|250px|Bi datu multzoen arteko ezberdintasunak erakusten dituzten '''kaxa-eta-beso diagramak''']]
[[Estatistika]]n, '''kaxa-eta-beso diagrama''', nazioartean '''boxplot''' izenez ere ezaguna, [[aldagai koantitatibo]] bat irudikatzeko [[datu-diagrama]] bat da, [[datuen azterketa esploratzaile]]an maiz erabili eta datu multzo bateko ezaugarriak ([[zentro neurri|zentroa]], [[sakabanatze neurri|sakabanatzea]], ...) modu integratuan eta grafikoan aztertzen azaltzen dituena. [[Muturreko datu]]ak atzemateko ere erabiltzen da. Bost [[laburkin (estatistika)|laburkin]] erabiltzen dira bere eraketarako: [[mediana]], lehenengo [[koartil]]a, hirugarren koartil, [[datu]] handiena eta datu txikiena. [[Aldagai kuantitatibo]] bati buruz, multzo zenbaiten arteko ezberdintasunak azaltzeko erabiltzen da sarri. Horretarako, diagramak batera jartzen dira [[eskala]] berean, modu bertikalean edo horizontalean. [[John Tukey]] estatistikariak garatu zuen 1970eko hamarkadan eta geroztik aldaera anitz izan dituen datu-diagrama da.
[[Estatistika]]n, '''kaxa-eta-beso diagrama''', laburrago '''kaxa-diagrama''', ingelesezko '''boxplot''' izenez ere ezaguna, [[aldagai koantitatibo]] bat irudikatzeko [[datu-diagrama]] bat da, datu multzo bateko ezaugarriak ([[zentro neurri|zentroa]], [[sakabanatze neurri|sakabanatzea]], ...) modu integratuan eta grafikoan aztertzen azaltzen dituena. [[Muturreko datu]]ak atzemateko ere erabiltzen da. Bost [[laburkin (estatistika)|laburkin]] erabiltzen dira bere eraketarako: [[mediana]], lehenengo [[koartil]]a, hirugarren koartil, [[datu]] handiena eta datu txikiena. [[Aldagai kuantitatibo]] bati buruz, multzo zenbaiten arteko ezberdintasunak azaltzeko erabiltzen da sarri. Horretarako, diagramak batera jartzen dira [[eskala]] berean, modu bertikalean edo horizontalean. [[John Tukey]] estatistikariak garatu zuen 1970eko hamarkadan, berak bultzaturiko [[datuen azterketa esploratzaile]] izeneko datuen azterketarako korrontearen baitan. Geroztik maiz erabiltzen da datu estatistikoak aurkezten dituzten txosten eta argitarapen zientifiko eta teknikoetan. Aldi berean, aldaera anitz izan dituen datu-diagrama da: hozkaturiko kaxa-diagrama, bibolin-diagrmaak, HDR diagramak, betseak beste.


== Eraketa ==
== Eraketa ==
6. lerroa: 6. lerroa:
Pauso hauek jarraitu behar dira, diagrama horizontalean marraztu nahi bada:
Pauso hauek jarraitu behar dira, diagrama horizontalean marraztu nahi bada:


* Kalkulatu lehenengo [[koartil]]a, [[mediana]] eta hirugarren [[koartil]]a.
# Kalkulatu lehenengo eta hirugarren [[koartil]]ak eta [[mediana]].
# [[Koartil arteko ibiltartea]], <math>I_Q</math> kalkulatu behar da: hirugarren koartila ken lehenengo koartila.

# Marraztu laukizuzen bat, kaxa alegia, ezkerretik lehenengo koartila eta eskuinetik hirugarren koartila mugatzat dituena.
* [[Koartil arteko ibiltartea]], <math>I_Q</math> kalkulatu behar da: hirugarren koartila ken lehenengo koartila.
# Mediana goitik beherako marra batez irudikatzen da kaxa barnean.

# Kaxa mugetatik harago, lehenengo edo hirugarren koartiletatik alegia, koartil arteko ibiltearen 1.5 halako baino gehiago desbideratzen diren datuak [[muturreko datu]]tzat hartzen dira.
* Marraztu laukizuzen bat, kaxa alegia, ezkerretik lehenengo koartila eta eskuinetik hirugarren koartila mugatzat dituena.
# Muturreko daturik ez badago, datu guztiak koartil arteko ibiltartearen 1.5 halako baino gutxiago desbideratzen direla esan nahi du. Kasu honetan, datu txikienaren punturaino eta datu handienaren punturaino beso bana luzatzen da. Baliteke beso bakarra luzatu behar izatea, aipatutako baldintza norabide bakar batean gertatzen bada.

* Mediana goitik beherako marra batez irudikatzen da kaxa barnean.

* Kaxa mugetatik harago, lehenengo edo hirugarren koartiletatik alegia, koartil arteko ibiltearen 1.5 halako baino gehiago desbideratzen diren datuak [[muturreko datu]]tzat hartzen dira.

* Muturreko daturik ez badago, datu guztiak koartil arteko ibiltartearen 1.5 halako baino gutxiago desbideratzen direla esan nahi du. Kasu honetan, datu txikienaren punturaino eta datu handienaren punturaino beso bana luzatzen da. Baliteke beso bakarra luzatu behar izatea, aipatutako baldintza norabide bakar batean gertatzen bada.
* Muturreko datuak bi motakoak dira: normalak eta apartekoak. Apartekoak lehenengo edo hirugarren koartiletatik koartil arteko ibiltartearen 3 halako baino gehiago desbideratzen direnak dira. Gurutze batez irudikatzen da bakoitza. Muturreko datu normalak apartekoak ez direnak dira eta puntu batez irudikatzen dira.


== Adibidea ==
== Adibidea ==

09:31, 16 azaroa 2012ko berrikusketa

Bi datu multzoen arteko ezberdintasunak erakusten dituzten kaxa-eta-beso diagramak

Estatistikan, kaxa-eta-beso diagrama, laburrago kaxa-diagrama, ingelesezko boxplot izenez ere ezaguna, aldagai koantitatibo bat irudikatzeko datu-diagrama bat da, datu multzo bateko ezaugarriak (zentroa, sakabanatzea, ...) modu integratuan eta grafikoan aztertzen azaltzen dituena. Muturreko datuak atzemateko ere erabiltzen da. Bost laburkin erabiltzen dira bere eraketarako: mediana, lehenengo koartila, hirugarren koartil, datu handiena eta datu txikiena. Aldagai kuantitatibo bati buruz, multzo zenbaiten arteko ezberdintasunak azaltzeko erabiltzen da sarri. Horretarako, diagramak batera jartzen dira eskala berean, modu bertikalean edo horizontalean. John Tukey estatistikariak garatu zuen 1970eko hamarkadan, berak bultzaturiko datuen azterketa esploratzaile izeneko datuen azterketarako korrontearen baitan. Geroztik maiz erabiltzen da datu estatistikoak aurkezten dituzten txosten eta argitarapen zientifiko eta teknikoetan. Aldi berean, aldaera anitz izan dituen datu-diagrama da: hozkaturiko kaxa-diagrama, bibolin-diagrmaak, HDR diagramak, betseak beste.

Eraketa

Pauso hauek jarraitu behar dira, diagrama horizontalean marraztu nahi bada:

  1. Kalkulatu lehenengo eta hirugarren koartilak eta mediana.
  2. Koartil arteko ibiltartea, kalkulatu behar da: hirugarren koartila ken lehenengo koartila.
  3. Marraztu laukizuzen bat, kaxa alegia, ezkerretik lehenengo koartila eta eskuinetik hirugarren koartila mugatzat dituena.
  4. Mediana goitik beherako marra batez irudikatzen da kaxa barnean.
  5. Kaxa mugetatik harago, lehenengo edo hirugarren koartiletatik alegia, koartil arteko ibiltearen 1.5 halako baino gehiago desbideratzen diren datuak muturreko datutzat hartzen dira.
  6. Muturreko daturik ez badago, datu guztiak koartil arteko ibiltartearen 1.5 halako baino gutxiago desbideratzen direla esan nahi du. Kasu honetan, datu txikienaren punturaino eta datu handienaren punturaino beso bana luzatzen da. Baliteke beso bakarra luzatu behar izatea, aipatutako baldintza norabide bakar batean gertatzen bada.

Adibidea

                            +-----+-+    
  *           o |-----------|     | |---|
                            +-----+-+    
                                         
+---+---+---+---+---+---+---+---+---+---+---+---+   eskala
0   1   2   3   4   5   6   7   8   9  10  11  12
  • Datu handiena 10 da.
  • Datu txikiena 0.5 da.
  • Muturreko datu aparteko bat dago: 0.5.
  • Muturreko datu normal bat badago: 3.5.

Interpretazioa

Kaxa-eta-beso diagramaren bitartez zentroa, sakabanatzea, alborapena eta kurtosia azter daitezke. Zentroaren berri medianak ematen du. Sakabanatzearen neurria koartil arteko ibiltarteak eman dezake, besoen luzerarekin batera: zenbat eta zabalago kaxa (koartil arteko ibiltartea) eta besoak, banakuntza sakabanatuagoa izango da. Alborapenaren berri kaxaren bi zatien eta besoen berdintasunek ematen dute. Kurtosia, azkenik, kaxaren eta besoen luzerak erkatuz azter daiteke.

Kanpo loturak

Wikimedia Commonsen badira fitxategi gehiago, gai hau dutenak: Kaxa-eta-beso diagramak