Histograma

Wikipedia(e)tik

Hona jo: nabigazioa, Bilatu
Pertsona multzo baten altueren histograma.

Histograma balio asko hartzen dituen aldagai koantitatibo bat, balio ezberdin asko hartzen dituena, grafikoki irudikatzeko erabiltzen den grafikoa da. Adibidez, garraiobide batek ibilbide bat egiteko behar duen denbora (minututan) jasotzen denean, pertsona ezberdinen altuerak jasotzen direnean edota zuhaitz enborren diametroak neurtzen direnean, emaitzak anitz izan daitezke. Aldagaiak balio asko har ditzakeenez, jarraia dela esan ohi da, komeni da balio ezberdinak tartetan biltzea. Tartekako bilketatik eratortzen den grafikoa histograma da. Ez da diagrama egokia datu kopurua txikiegia denean (20 bat baino gutxiago); kasu horretan puntu diagrama egokiagoa da.

Eduki-taula

[aldatu] Etimologia

Antzinako greziera eratortzen da hitza da: histos, zutik dagoen gauza; gramma, marrazkia, idazkia.

[aldatu] Eraketa

Histograma eratzeko, beharrezkoa da aurretik jatorrizko datuak tartetan biltzea. Ondoren, tarte bakoitzeko maiztasun absolutu eta erlatiboak kalkulatuko dira, tarte bakoitzean zenbat datu biltzen den absolutuki eta ehunekotan alegia.

Ardatz kartesiarrak hartuz, abzisetan tarteak eta ordenatuetan maiztasunak (absolutuak edo erlatiboak) ezarriko dira.

[aldatu] Adibide bat

Har ditzagun datu hauek, tomate bariedade jakin bateko pisuari buruzkoak, kilotan:

0,547 0,563 0,532 0,521 0,514 0,547 0,578 0,532 0,552 0,526 0,534 0,560 0,502 0,503 0,516 0,565
0,532 0,574 0,521 0,523 0,542 0,539 0,543 0,548 0,565 0,569 0,574 0,596 0,547 0,578 0,532 0,552
0,554 0,596 0,529 0,555 0,559 0,503 0,499 0,526 0,551 0,589 0,588 0,568 0,564 0,568 0,556 0,523
0,526 0,579 0,551 0,584 0,551 0,512 0,536 0,567 0,512 0,553 0,534 0,559 0,498 0,567 0,589 0,579

Datuak 7 tartetan biltzea erabakitzen bada, hau izan daiteke datu taula eta ondoriozko histograma:

Tomateen pisuak
Tartea (kilotan) Tomateak
0.495-0.510 5
0.510-0.525 8
0.525-0.540 12
0.540-0.555 14
0.555-0.570 13
0.570-0.585 7
0.585-0.600 5

Tomateen pisuei buruzko histograma.

[aldatu] Tarteak

Tarteek espresuki bestela adierazten ez badute, tarteak eskuinetik irekiak eta ezkerretik itxiak direla pentsatu behar da, [-,-) motakoak alegia. Honela, 0.570 kiloko tomate bat 0.570-0585 tartean barneratu behar da eta ez aurreko 0.555-0570 tartean.

Tarte kopuru egokiena 5etik 15era bitartekoa izango da. Aldagaiaren izaera ere kontuan hartuko da tarteak finkatzeko orduan: adibidez, adinari buruzko ohizko tarteak izaten dira 15 urte-20 urte, 20 urte -25 urte, ...

Ez dago ordea, tarte kopuru hoberenik. Tarte kopuru ezberdinek datu multzoaren ezaugarri ezberdinak erakuts ditzakete eta beraz, komeni da tarte kopuru ezberdinekin saiatzea, datu multzoaren ezaugarri aipagarrienak azaltzen dituen hura aukeratu arte.

Suertatuko den tarte kopurua erraz kalkula daiteke, aurrez h tarte zabalera bat finkatzen bada:

k =  \frac{\max x - \min x}{h}

Adibidez, datu handiena eta txikiena 80 eta 15 badira hurrenez hurren, tartearen zabalera 10 izanik:

k =  \frac{80 - 15}{10}=6.5

Gehiegiz borobilduz 7 tarte suertatuko dira: 10-20, 20-30, ...

Badira ordea formula matematikoak ustez k tarte kopurua edo h tarte zabalera egokia ematen dutenak, gehienetan datu kopuru edo lagin tamainuaren arabera:

k = log2n + 1, gehiegiz borobilduz eta n lagin tamaina izanik.
h = \frac{3.5 s}{n^{1/3}}, non s desbidazio estandarra den.
h = 2 \frac{\operatorname{I_Q}}{n^{1/3}}, non

IQ koartil arteko ibiltartea den.

  • Bestelako formulak:
k= 1 + \frac{10 \log(n)}{3}
k = \sqrt{n}\,

[aldatu] Tarte zabalera ezberdinak

Argitasunagatik komeni tartearen zabalera konstantea izatea, baina batzuetan, histograman zehar maiztasunik gabeko hutsuneak sor ez daitezen, tarteak batera jartzen dira. Beste batzuetan, hasierako eta bukaerako tarteak mugatu gabe uztea gomendatzen da (>100, <25).

Tarte zabalera ezberdina denean, histograma altxatzeko aldaketa batzuk egin behar dira, zutabeek datuen trinkotasuna egoki irudika dezaten. Zehatzago, tarte bakoitzeko zutabearen altuera, a, honela kalkulatuko da, n, tarteko maiztasuna eta h tarte zabalera izanik:

a=\frac{n}{h}

Noski, horrela histigramako zutabeek ez dute adieraziko maiztasuna (absolutuki edo erlatiboki), baina datuen trinkotasuna ordea bai.

[aldatu] Interpretazioa

Errealitateko aldagai askoren banakuntza normaltzat hartzen da, banakuntza honek dituen propietateak direla eta. Histogramaren itxura banakuntza normalak erakusten duen kanpai itxurarekin alderatu ohi da, datuetarako ezarri daitekeen erabakitzeko. Banakuntza normala eredu bezala aukeratzeko lehenengo hurbilketa izango da, tresna estatistiko konplexuagoak eta zorrotzagoak daudelako azken erabakia hartzeko.

Bestelako interpretazioak ere eman daitezke: zentroa non kokatzen den gutxigorabehera ematen digu eta sakabanatzea histogramaren zabalerari begiratuz azter daiteke.

Interpretazio konplexuagoak ere egin daitezke. Adibidez, lantegi batean ekoiztutako baterien iraupenari buruzko datuak jasota, beheko histograma hauek har ditzagun.

Bi motako elementuak erakusten dituen histograma

Ondoko histograma honetan, bi motako bateriak daudela nabaritzen da, orohar batak iraupen txikiagoak dituena besteak baino, agian ekoizpen prozesuan izandako aldaketak direla eta.

Zentro gertuko bi motako elementuak erakusten dituen histograma

Bigarren histograma honetan, zentroa oso gertu duten bi bateria mota nabaritzen da, baina biak ezberdinak hala ere.

Moztutako histograma

Azken histograma honetan, moztuta azaltzen dena, iraupen batetik beherako bateriak baztertu direla ikus daiteke, alborapen nabarmena baitago.

[aldatu] Baterako histogramak

Ohizkoa da, datu multzo ezberdinak erkatu nahi denean, datu multzo hauei dagokien histogramak batera eratzea, beraien arteko ezaugarri estatistiko ezberdinak argiago ikusteko (zentroa, sakabanatzea, ...).

Baterako histogramak herri bateko gizon eta emakumeen adinak azaltzen dituena: emakumezkoek adin altuagoa dute oro har eta sakabanatuagoak dira adinari buruz.

[aldatu] Histograma metakorrak

Histograma maiztasun metatuekin kalkulatzen bada, maiztasun bakunekin kalkulatu ordez (ikus maiztasun (estatistika)), suertatzen den histogramari histograma metakorra deituko zaio. Histograma metakorrak oso erabilgarriak dira koantilak aztertzeko.

Histogramak (ezker aldean) eta dagozkien histograma metakorrak (eskuin aldean)

[aldatu] Ikus gainera

Tresna pertsonalak