Giniren koefiziente

Wikipedia(e)tik
Hona jo: nabigazioa, Bilatu

Estatistikan, Giniren koefizientea errentaren banaketa eta bestelako aldagaien kontzentrazioa edo ezberdintasuna neurtzen duen koefiziente bat da. Kontzentrazioa aztertzeko erabiltzen den Lorenzen kurban oinarriturik, kontzentrazioaren neurketa absolutu bat ematen du, 0 balio batetik, kontzentrazioa erabat uniformea denean, 1 balio batera, kontzentrazioa erabatekoa denean. Gainera, errentaren banaketaren kasuan, bi banakoen arteko errenta-aldearen batez bestekoarekin loturik dago. Errenta banaketaz gainera, beste arlo anizetan erabiltzen den koefizientea da, betiere kontzentrazioa aztertzeko, Wikipedian egiten diren ekarpenen kontzentrazioa, lankide ezberdinen artean, aztertzeko kasu. Koefizientea Corrado Gini estatistikari italiarrak asmatu zuen 1912an.

Eduki-taula

Giniren koefizientea eta Lorenzen kurba [aldatu]

Datuetan oinarrituta kalkulatu den Lorenzen kurba baterako, Ginik koefiziente sinple hau planteatu zuen hasiera batean, Lorenzen kurbako pi,qi (% metatua banako kopuruari buruz eta % metatua totalari buruz, hurrenez hurren) puntuetatik abiatuta:

G=\frac{\sum_{i=1}^{n-1}(p_i-q_i)}{\sum_{i=1}^{n-1}p_i}

Izan ere, pi,qi balioen arteko aldeak, i bakoitzeko, zenbat eta handiagoak izan, orduan eta kontzentrazio handiagoa dago[1].

Lorenzen kurba erabateko berdintasuna adierazten duen diagonaletik zenbat eta urrunago izan, kontzentrazioa handiagoa denez, Ginik beste formula hau ere, maizago erabiltzen dena, proposatu zuen diagonalaren eta Lorenzen kurbaren artean dagoen azaleraren balioa hurbiltzeko [2][3]:

G = \frac{\frac12- \frac{\sum_{i=1}^{n} (p_{i} - p_{i-1})q_i+\sum_{i=1}^{n} (p_{i} - p_{i-1})q_{i-1}}{2}}{2}=1- \sum_{i=1}^{n} (p_{i} - p_{i-1}) (q_{i} + q_{i-1})
490
Lorenzen kurba diagonaletik zenbat eta urrunago, orduan eta kontzentrazio handiagoa. Beraz, kontzentrazioa Lorenzen kurbatik diagonalera dagoen azalera erlatiboaren bitartez, diagonalaren azpiko azalera osoarekiko, neur daiteke: a/(a+b). Giniren koefizientea ideia hau bereganatzen duen kontzentrazio-neurria da.
490
Bere ohiko formulazioan, Giniren koefizientea diagonaletik Lorenzen kurbara dagoen azalera erlatiboa da, diagonal azpiko azalera osoarekiko. Diagonal azpiko azalera 1/2 da. Beraz, diagonaletik Lorenzen kurbara dagoen azalera 1/2 ken Lorenzen kurbaren azpitik dagoen azalera da. Irudian, Lorenzen kurbako zati horietako bat agertzen da. Bere azalera honela kalkulatzen da: OACE=(OADE+OBCE)/2=[(pi-1-pi)qi-1+(pi-1-pi)qi]/2. Zati bakoitzeko azalera horrela kalkulaturik, 1/2 ken zati guztietako azaleren batura kalkulatzen da. Lorenzen kurbatik diagonalera dagoen azalera kalkulatzeko. Koefizientea normalizatzeko, emaitza azalera maximoarekin, hots, diagonal azpiko azalera osoarekin (1/2) zatitzen da.

Adibidea [aldatu]

Familien errentari buruzko inkesta bat egin ondoren, honako taula honetako lehenengo bi zutabeak eratu dira:

Errenta tartea Familiak (n) xi (errenta balioa) n×xi (errenta totala) Errenta total metatuak qi (% errenta) Familia metatuak pi (% familiak)
0-10 10 5 50 50 0.0322 10 0.2
10-50 30 25 750 800 0.5161 40 0.8
50-100 10 75 750 1550 1 50 1

Errenta tarte bakoitzeko erdiko puntua hartzen da balio adierazgarri gisa, ohi den bezala. Lorenzen kurbako pi, qi balio bikoteak kalkulaturik, Giniren koefizientea kalkula daiteke. Lehenengo formula erabiliz:

pi (% errenta) qi (% familiak) pi-qi
0.2 0.0322 0.1678
0.8 0.5161 0.2839
1 1 0
G=\frac{\sum_{i=1}^{n-1}(p_i-q_i)}{\sum_{i=1}^{n-1}p_i}=\frac{0.1678+0.2839}{0.2+0.8}=0.4517

Bigarren formula, egokiagoa dena, erabiliz gero:

pi (% errenta) qi (% familiak) (pi-pi-1)(qi+qi-1)
0.2 0.0322 (0.2-0)×(0.0322+0)=0.00644
0.8 0.5161 (0.8-0.2)×(0.5161+0.0322)=0.32898
1 1 (1-0.8)×(1+0.5161)=0.30322
G = 1- \sum_{i=1}^{n} (p_{i} - p_{i-1}) (q_{i} + q_{i-1})=1-(0.00644+0.32898+0.30322)=0.36136

Bigarren formulak Lorenzen kurbak hartzen duen azalera erlatiboaren neurri zehatza da eta, beraz, lehenengo formulak errore nabarmena dakarrela ikusten da, batez ere aldagaiak hartzen dituen balio ezberdinak, 3 kasu honetan, gutxi direnean.

Banakako datuetarako kalkulua nola egiten den ikusteko, ikus Lorenzen kurba.

Giniren koefizientea eta banakoen arteko aldea [aldatu]

Frogatzen da Giniren koefizientea[4], errenten kasuan esaterako, erlazionaturik dagoela zoriz aukeraturiko bi banakoren errenten artean dagoen batez besteko alde erlatiboarekin, errentaren batez bestekoarekiko. Adibidez, Giniren koefizientea 0.4 bada, bi banakoren arteko errenten batez besteko aldea banako guztien batez besteko errentaren %80 da. Zehatzago, \Delta\, eta \overline{x}\, zoriz aukeraturiko bi banakoen balioen arteko aldearen batez bestekoa eta balio guztien batez bestekoa izanik[5]:


G=\frac{\Delta}{2\overline{x}}=\frac{\sum_{i=1}^n\sum_{j=1}^n|x_i-x_j|}{2n^2\overline{x}}


Balio guztiak txikienetik handienera ordenatzen badira, formula horrela geratzen dela froga daiteke:


G=\frac{\Delta}{2\overline{x}}=\frac{2\sum_{i=1}^ni(x_i-\overline{x})}{n^2\overline{x}}

Erreferentziak [aldatu]

  1. Izendatzailean, pi balioen baturak pi-qi aldeen baturaren maximoa adierazten du (qi guztiak 0 direnean gertatzen da) eta kontzentrazio handieneko erreferentzia gisa hartzen da Batura pi,qi guztietarako egiten da, azkenekorako ezik, azkeneko diferentzia beti 0 denez, ez baita kontuan hartzen.
  2. Arestian emandako lehenengo formulak ez baitu modu egokian hurbiltzen Lorenzen kurba gaineko azalera, aldagaiaren balio ezberdinak gutxi direnean. Ikus: (Gaztelaniaz) Ferreira, Eva; Garín, Araceli (1997), «Una nota sobre el cálculo del índice de Gini», Estadística Española 39 (142): 207-218, http://www.ine.es/revistas/estaespa/142_9.pdf 
  3. Bi formulak lan honetan ikus daitezke: (Gaztelaniaz) Gini, Corrado (1953), Curso de estadística 
  4. Bere bertsio zehatzean.
  5. Bi banakoak aukeratzerakoan, bi aldietan banako berdina daitezkeela hartzen da kontuan. Horregatik egiten da zatiketa n2 balioaz.