Batezbesteko aritmetiko sinple

Wikipedia(e)tik
Hona jo: nabigazioa, Bilatu
Batez besteko aritmetiko sinplea datuen grabitate-zentroa da: datu guztiak balantza batean jarrita, oreka batez besteko aritmetikoari dagokion puntuan kokatzen da.

Batezbesteko aritmetiko sinplea estatistikan maiz erabiltzen den batezbesteko eta zentro-joerako neurri bat da. Batezbesteko gisa, datu-multzo baten batez besteko aritmetiko sinplearen inguruan biltzen dira datu guztiak, datuen gutxi gorabeherako zentro-joera bat emanez. Beraz, bere helburua, datu guztiak balio bakar batez adierazi edo ordeztea da [1].

Adibidez, ikasle batek bi azterketetan lortutako kalifikazioak 6 eta 8 izan badira, kalifikazioen batezbesteko aritmetiko sinplea 7 da [2] (kalifikazioak batuz eta kalifikazio kopuruaz zatituz: (6+8)/2=7) eta, beraz, kalifikazio orokorra 7 dela esan daiteke.

Zentro-joerarako neurri eta batezbesteko guztietan gehien erabiltzen den neurria da, bere kalkuluaren erraztasunagatik eta esanahiaren argitasunagatik. Horregatik, batezbesteko aritmetiko sinplea izen osoa aipatu ordez, batezbesteko esan ohi da laburrago. Egunerokoan, aplikazio zabalak dituen neurria da: ikasle batek azterketa ezberdinetan lorturiko batez besteko kalifikazioa lortzeko, azterketa batean ikasle zenbaitek lorturiko kalifikazioen batezbestekoa kalkulatzeko, hil ezberdinetan zehar hileko kontsumitu den batez besteko argindar-kopurua emateko, denda batean egunero batez bestez zenbat saltzen den zenbatesteko, futbol jokalari batek partidu bakoitzean zenbat gol egiten dituen jakiteko, eta abar. Datuetarako kalkulatzeaz gainera, probabilitate-banaketa eta bestelako objektu matematikoetarako ere kalkulatu daitekeen neurria da, itxaropen matematikoaren bitartez.

Kalkulua lagin baterako[aldatu | aldatu iturburu kodea]

Lagin bateko datuak x_1,\ x_2,\ldots,\ x_n izanik, honela izendatu eta kalkulatzen da batezbesteko aritmetiko sinplea:

\overline{x}=\frac{\sum_i x_i}{n}=\frac{x_1+x_2+\cdots+x_n}{n}

Hau da, batez besteko aritmetiko sinplea kalkulatzeko, eskuartean dauden datuak batu eta datu kopuruaz zatitu behar da. Batura egin ahal izateko, datuak fenomeno berari buruzkoak izan behar dira (adibidez ikasleen kalifikazioak, jokalari batek partidu ezberdinetan sartu dituen gol-kopuruak, denda bateko salmentak egunez egun).

Datu bakoitza zenbait aldiz errepikatu eta maiztasun taula batean bilduta agertzen direnean, formula honi jarraiki kalkulatzen da:

\overline{x}=\frac{\sum_i n_ix_i}{\sum_i n_i}

Datuak tartean bilduta agertzen direnean, tarte bakoitzeko erdiko puntua hartu eta arestiko formula erabiltzen da. Kasu honetan, ordea, errore bat sortzen da tarteko datu guztiak tarteko erdiko puntuaz ordeztean, baina datuak tartean uniformeki banatzen badira, erroreak konpentsatu eta hurbilketa jatorriko datuen batez besteko aritmetikoaren oso gertu izango dela ziurta daiteke.

Egoera batzuetan, azkenik, datuen batura edo guztirakoa ematen da zuzenean, elementu kopuruarekin batera. Batez besteko aritmetiko sinplea kalkulatzeko guztirakoa zati elementu kopurua egiten da. Adibidez, 10 denda dituen enpresa bateko salmentak 200.000 eurokoak izan badira, dendako batez besteko salmenta 200.000/10=20.000 eurokoa izango da. 100 egunetan 20000 euroko salmentak izan badira, eguneko batez besteko salmenta 20000/100= 200 eurokoa izan da.

Adibideak[aldatu | aldatu iturburu kodea]

Datu isolatuak[aldatu | aldatu iturburu kodea]

Adibidez, 5 ikasleren kalifikazioak 4-5-3-7-6 badira (puntutan), hau izango batezbesteko aritmetiko bakuna:

\overline{x}=\frac{\sum_i x_i}{n}=\frac{4+5+3+7+6}{5}=5

Beraz, ikasleek oro har eta batez beste 5 puntu izan dutela adierazi behar da.

Pausoz pauso eginez:

Ikasle   Kalifikazioa
 1           4              ·Lehendabizi, kalifikazioak batu:
 2           5                    4+5+3+7+6=25
 3           3              ·Ondoren, datuen batura ikasle kopuruaz zatitzen da:
 4           7                    25/5=5
 5           6              ·Batez besteko kalifikazioa 5 puntu da.

Datuak maiztasun-tauletan[aldatu | aldatu iturburu kodea]

Datuak errepikatzen direnean ere, datu guzti guztiak batu behar dira. Hau da, datuak dira batu beharrekoak eta ez aldagaiak hartzen dituen balio ezberdinak. Adibidez, 2 ikaslek 5, 3 ikaslek 6 eta ikasle batek 8 lortu badute, ikasleen batez besteko kalifikazioa hau da:

\overline{x}=\frac{5+5+6+6+6+8}{6}=\frac{2 \times 5 + 3 \times 6 + 1 \times 8}{6}=6

Zuzenean maiztasun-taula hartzen bada, lehenengo bi zutabeetan, honela egin daitezke kalkuluak modu ordenatuagoan hirugarren zutabe bat osatuz:

xi(balioak) ni(maiztasunak) nixi
5 2 10
6 3 18
8 1 8
baturak 6 36
\overline{x}=\frac{\sum_i n_ix_i}{\sum_i n_i}=\frac{36}{6}=6

Datuak tartetan[aldatu | aldatu iturburu kodea]

Datuak tartetan agertzen direnean, lehenengo bi zutabeetan bezala, non lan bat egiteko pertsona ezberdinek behar izan dituzten denborak agertzen diren minututan (40 minutura arte), tarteko erdiko puntua hartu eta maiztasun-taula bat balitz bezala jokatzen da, baina emaitza jatorriko datuen batez bestekoaren hurbilketa izango da:

tartea ni(maiztasunak) xi(balioak) nixi
0-10 2 5 10
10-20 3 15 45
20-30 4 25 100
30-40 1 35 35
baturak 10 190
\overline{x}=\frac{\sum_i n_ix_i}{\sum_i n_i}=\frac{190}{10}=19

Lana egiteko pertsona batek behar duen batez besteko denbora 19 minutu da.

Ezaugarriak[aldatu | aldatu iturburu kodea]

Bere abantailen artean, kalkuluaren erraztasuna eta esanahi argia aipatu behar dira. Bere adierazpen matematikoaren sinpletasunak gainera garapen matematiko sakonagoa ahalbideratzen du. Bere kalkuluan datu guztiak haztapen edo pisu kontuan hartzen ditu, datu guztiei garrantzi berdina emanez. Hau, ordea, eragozpen bat izan daiteke egoera batzuetan, adibidez ondasun ezberdinen prezio-igoera batezbestekoa kalkulatzean, prezio batzuen igoera, dagozkien produktua gehiago kontsumitzean, garrantzi handiagokoa izan baitaiteke[3]. Datuei pisu ezberdina eman behar zaienean, batez besteko aritmetiko haztatua erabili behar da, batezbesteko aritmetiko sinplearen ordez.

Eragozpen nagusi moduan, muturreko datuekiko jasankorra ez dela aipatu behar da, muturreko datuek batezbesteko aritmetiko sinplearen emaitzan eragin handia dutela alegia. Adibidez, datuak 2-2-2-2-22 izanik, batezbesteko aritmetiko sinplearen balioa 6 da eta argi dago 6 balioa ez dela datu multzo osoaren adierazgarri: arrazoia 22 datua da, oso handia denez, batezbesteko aritmetiko sinplea gorantz baitarama.

Batezbesteko aritmetiko sinplea zenbatesle gisa[aldatu | aldatu iturburu kodea]

Populazio baterako, batezbesteko aritmetiko sinplea balio ezezagun interesgarria izaten da, populazio osoa balio bakar batean laburbiltzen duen balioa baita. Kasu honetan, batezbesteko aritmetiko sinplea parametroa dela esaten da. Populazio bateko batezbesteko aritmetiko sinplea zenbatesteko, lagin bat aukeratu eta lagin-datuen batezbesteko aritmetiko sinplea erabil daiteke. Bereizi behar dira, beraz, populazio bateko batezbesteko aritmetiko sinplea (itxaropen matematiko izenez ere ezagutzen dena), μ (mu) hizki grekoaz, adierazi ohi dena, eta lagin-datuen batezbesteko aritmetiko sinplea, \overline{x} ohiko ikurraz adierazten dena: \overline{x} lagin-batez bestekoa μ populazio-batezbestekoa zenbatesteko erabiltzen da edota \overline{x} zenbatesle gisa erabiltzen dela esaten da. Zenbatespenaren fidagarritasuna edo lagin-batezbestekoaren kalkuluan jaso beharreko datu-kopuruaren zehaztapena inferentzia izeneko arlo estatistikoari dagokio.

Populazioaren batezbestekoaren zenbatesle gisa, batezbesteko aritmetiko sinplea zenbatesle alboragabea da:

E[\overline{x}]=\mu

Bere bariantza hau da, n lagin tamaina eta \sigma^2 populazio-bariantza izanik:

\sigma^2_{\overline{x}}=\frac{\sigma^2}{n}

Hau da, zenbat eta datu gehiago jaso, batez besteko aritmetikoaren balioak orduan eta gutxiago aldatu dira populazio-batez bestekoaren inguruan, balio fidagarriagoak emanez.

Konfiantza-tarteak[aldatu | aldatu iturburu kodea]

Populazio-batez bestekoari buruzko konfiantza-tartea honela osatzen da batez besteko aritmetiko sinplean oinarriturik, populazio normaletarako eta \sigma populazioaren desbideratze estandarra ezezaguna denean:

\overline{x}-t_{n-1,\frac{\alpha}{2}}\frac{\hat{s}}{n}<\mu<\overline{x}+t_{n-1,\frac{\alpha}{2}}\frac{\hat{s}}{n}

Lagin-tamaina handia denean (n>30), Studenten t banaketaren ordez banaketa normala erabil daiteke:

\overline{x}-z_{\frac{\alpha}{2}}\frac{\hat{s}}{n}<\mu<\overline{x}+z_{\frac{\alpha}{2}}\frac{\hat{s}}{n}

Bi kasuetan ezezaguna den populazioaren desbideratzea \hat{s} quasi-bariantzaren bitartez zenbatesten da.

Bestelako populazioetarako batez besteko aritmetiko sinpleak banaketa konplexuagoa erakusten du eta konfiantza-tarteen eraketa oso zaila da, baina lagin tamaina handia denean, 30 baino handiagoa gutxi gorabehera, azken formulari jarraiki egin daiteke, limitearen teorema zentralari esker.

Erreferentziak[aldatu | aldatu iturburu kodea]

  1. Horrela, batez besteko aritmetiko sinple bat kalkulatzean, informazio galera gertatzen dela esan daiteke, datu guztiak balio bakar batez adierazten baitira.
  2. Bi azterketek garrantzi berdina badute, bestela batez besteko aritmetiko haztatua erabili behar baita.
  3. Beste adibide bat garrantzi ezberdina duten azterketen batez besteko kalifikazioari buruzkoa da.

Ikus, gainera[aldatu | aldatu iturburu kodea]