Giniren koefiziente
Estatistikan, Giniren koefizientea errentaren banaketa eta bestelako aldagaien kontzentrazioa edo ezberdintasuna neurtzen duen koefiziente bat da. Kontzentrazioa aztertzeko erabiltzen den Lorenzen kurban oinarriturik, kontzentrazioaren neurketa absolutu bat ematen du, 0 balio batetik, kontzentrazioa erabat uniformea denean, 1 balio batera, kontzentrazioa erabatekoa denean. Gainera, errentaren banaketaren kasuan, bi banakoen arteko errenta-aldearen batez bestekoarekin loturik dago. Errenta banaketaz gainera, beste arlo anizetan erabiltzen den koefizientea da, betiere kontzentrazioa aztertzeko, Wikipedian egiten diren ekarpenen kontzentrazioa, lankide ezberdinen artean, aztertzeko kasu. Koefizientea Corrado Gini estatistikari italiarrak asmatu zuen 1912an.
Eduki-taula |
Giniren koefizientea eta Lorenzen kurba [aldatu]
Datuetan oinarrituta kalkulatu den Lorenzen kurba baterako, Ginik koefiziente sinple hau planteatu zuen hasiera batean, Lorenzen kurbako pi,qi (% metatua banako kopuruari buruz eta % metatua totalari buruz, hurrenez hurren) puntuetatik abiatuta:
Izan ere, pi,qi balioen arteko aldeak, i bakoitzeko, zenbat eta handiagoak izan, orduan eta kontzentrazio handiagoa dago[1].
Lorenzen kurba erabateko berdintasuna adierazten duen diagonaletik zenbat eta urrunago izan, kontzentrazioa handiagoa denez, Ginik beste formula hau ere, maizago erabiltzen dena, proposatu zuen diagonalaren eta Lorenzen kurbaren artean dagoen azaleraren balioa hurbiltzeko [2][3]:
Adibidea [aldatu]
Familien errentari buruzko inkesta bat egin ondoren, honako taula honetako lehenengo bi zutabeak eratu dira:
| Errenta tartea | Familiak (n) | xi (errenta balioa) | n×xi (errenta totala) | Errenta total metatuak | qi (% errenta) | Familia metatuak | pi (% familiak) |
|---|---|---|---|---|---|---|---|
| 0-10 | 10 | 5 | 50 | 50 | 0.0322 | 10 | 0.2 |
| 10-50 | 30 | 25 | 750 | 800 | 0.5161 | 40 | 0.8 |
| 50-100 | 10 | 75 | 750 | 1550 | 1 | 50 | 1 |
Errenta tarte bakoitzeko erdiko puntua hartzen da balio adierazgarri gisa, ohi den bezala. Lorenzen kurbako pi, qi balio bikoteak kalkulaturik, Giniren koefizientea kalkula daiteke. Lehenengo formula erabiliz:
| pi (% errenta) | qi (% familiak) | pi-qi |
|---|---|---|
| 0.2 | 0.0322 | 0.1678 |
| 0.8 | 0.5161 | 0.2839 |
| 1 | 1 | 0 |
Bigarren formula, egokiagoa dena, erabiliz gero:
| pi (% errenta) | qi (% familiak) | (pi-pi-1)(qi+qi-1) |
|---|---|---|
| 0.2 | 0.0322 | (0.2-0)×(0.0322+0)=0.00644 |
| 0.8 | 0.5161 | (0.8-0.2)×(0.5161+0.0322)=0.32898 |
| 1 | 1 | (1-0.8)×(1+0.5161)=0.30322 |
Bigarren formulak Lorenzen kurbak hartzen duen azalera erlatiboaren neurri zehatza da eta, beraz, lehenengo formulak errore nabarmena dakarrela ikusten da, batez ere aldagaiak hartzen dituen balio ezberdinak, 3 kasu honetan, gutxi direnean.
-
-
- Banakako datuetarako kalkulua nola egiten den ikusteko, ikus Lorenzen kurba.
-
Giniren koefizientea eta banakoen arteko aldea [aldatu]
Frogatzen da Giniren koefizientea[4], errenten kasuan esaterako, erlazionaturik dagoela zoriz aukeraturiko bi banakoren errenten artean dagoen batez besteko alde erlatiboarekin, errentaren batez bestekoarekiko. Adibidez, Giniren koefizientea 0.4 bada, bi banakoren arteko errenten batez besteko aldea banako guztien batez besteko errentaren %80 da. Zehatzago,
eta
zoriz aukeraturiko bi banakoen balioen arteko aldearen batez bestekoa eta balio guztien batez bestekoa izanik[5]:
Balio guztiak txikienetik handienera ordenatzen badira, formula horrela geratzen dela froga daiteke:
Erreferentziak [aldatu]
- ↑ Izendatzailean, pi balioen baturak pi-qi aldeen baturaren maximoa adierazten du (qi guztiak 0 direnean gertatzen da) eta kontzentrazio handieneko erreferentzia gisa hartzen da Batura pi,qi guztietarako egiten da, azkenekorako ezik, azkeneko diferentzia beti 0 denez, ez baita kontuan hartzen.
- ↑ Arestian emandako lehenengo formulak ez baitu modu egokian hurbiltzen Lorenzen kurba gaineko azalera, aldagaiaren balio ezberdinak gutxi direnean. Ikus: (Gaztelaniaz) Ferreira, Eva; Garín, Araceli (1997), «Una nota sobre el cálculo del índice de Gini», Estadística Española 39 (142): 207-218, http://www.ine.es/revistas/estaespa/142_9.pdf
- ↑ Bi formulak lan honetan ikus daitezke: (Gaztelaniaz) Gini, Corrado (1953), Curso de estadística
- ↑ Bere bertsio zehatzean.
- ↑ Bi banakoak aukeratzerakoan, bi aldietan banako berdina daitezkeela hartzen da kontuan. Horregatik egiten da zatiketa n2 balioaz.





