Giniren koefiziente

Wikipedia(e)tik
Hona jo: nabigazioa, Bilatu
Lorenz kurba zenbat eta urrunago izan diagonaletik, kontzentrazioa orduan eta handiagoa da. Giniren koefizienteak urruntzea modu erlatiboan neurtzen du, a/(a+b) zatiketa kalkulatuz. Lorenz kurbako puntuak banakoen %35ek errenta osoaren %10a hartzen duela adierazten du.

Estatistikan, Giniren koefizientea errentaren desberdintasunaren neurketarako eta beste aldagaien kontzentrazioa neurtzen duen koefiziente bat da. Sakabanatze neurri moduan asmatu bazen ere, kontzentrazioa aztertzeko erabiltzen den Lorenzen kurbarekin loturik dagoen formulazioa da ezagunena. Giniren koefizienteak erabateko berdintasuna adieratzen duen 0tik erabateko kontzentrazioa adierazten duen 1era bitarteko balioak hartzen ditu; horrela, zenbat eta handiagoa izan, banaketan orduan eta kontzentrazio edo desberdintasun handiagoa dagoela ondorioztatzen da. Errenta banaketaz gainera, beste hainbat aldagai sozioekonomikoen kontzentraziorako erabiltzen da, hala nola osasunarekin eta hezkuntzarekin loturik. Bestelako aldagaietarako ere erabiltzen da, Wikipedian egiten diren ekarpenen kontzentrazioa, lankide ezberdinen artean, aztertzeko kasu. Kontzentrazioaz gainera, beste ezaugarri batzuk neurtzeko ere erabili izan da. Koefizientea Corrado Gini italiar estatistikariak asmatu zuen 1912an eta egun praktikan gehien erabiltzen desberdintasun ekonomikoaren koefizientea da.[1]

Giniren koefizientea eta Lorenzen kurba[aldatu | aldatu iturburu kodea]

Bere ohiko formulazioan, Giniren koefizientea diagonaletik Lorenzen kurbara dagoen azalera erlatiboa da, diagonal azpiko azalera osoarekiko. Diagonal azpiko azalera 1/2 da. Beraz, diagonaletik Lorenzen kurbara dagoen azalera 1/2 ken Lorenzen kurbaren azpitik dagoen azalera da. Irudian, Lorenzen kurbako zati horietako bat agertzen da. Bere azalera honela kalkulatzen da: OACE=(OADE+OBCE)/2=[(pi-1-pi)qi-1+(pi-1-pi)qi]/2. Zati bakoitzeko azalera horrela kalkulaturik, 1/2 ken zati guztietako azaleren batura kalkulatzen da. Lorenzen kurbatik diagonalera dagoen azalera kalkulatzeko. Koefizientea normalizatzeko, emaitza azalera maximoarekin, hots, diagonal azpiko azalera osoarekin (1/2) zatitzen da.

Ohiko formulazioan, Giniren koefizientea Lorenz kurbarekin loturik dago. Lorenz kurbak banako guztien arteko kontzentrazioaren egitura osoa adierazten du, banako ehuneko pobreen orok (pi) errenta osotik hartzen duen proportzioa (qi) zehaztuz. Berdintasun-egoera adierazten duen diagonaletik zenbat eta urrunago egon, kontzentrazioa orduan eta handiagoa da. Horrela, Lorenz kurbaren eta diagonalaren arteko azalera har daiteke kontzentrazio-neurri moduan. 0 eta 1 arteko balioak har ditzan, azalera hori kontzentrazio handieneko azalerarekin (irudian, a+b azalera, Lorenz kurbaren ardatzak 0 eta 1 bitartekoak direla kontuan hartuz, 1/2 balio duena) zatitzen da. Zatiketa horren emaitza da Giniren koefizientea:[2]

G=\frac{a}{a+b}=\frac{a}{\frac12}=2a=2(a+b-b)=2(a+b)-2b=2 \times \frac12 - 2b=1-2b

Kontzentrazioa datuetatik egiten denean, Lorenz kurba osatzen duten pi,qi puntuak (% metatua banako kopuruari buruz eta % metatua totalari buruz, hurrenez hurren) erabiltzen dira Giniren koefizientea kalkulatzeko. Puntu horietatik Giniren koefizientea, azalera moduan, zehaztasunez kalkulatzen duen adierazpena hau da:

G = \frac{\frac12- \frac{\sum_{i=1}^{n} (p_{i} - p_{i-1})q_i+\sum_{i=1}^{n} (p_{i} - p_{i-1})q_{i-1}}{2}}{2}=1- \sum_{i=1}^{n} (p_{i} - p_{i-1}) (q_{i} + q_{i-1})

Adibidea[aldatu | aldatu iturburu kodea]

Pertsona zenbaiten errentak jaso dira: 2-3-5-10 (moneta-unitatetan). Datuak ordenaturik (1. zutabea), Lorenz kurbako pi eta qi puntuak (3. eta 4. zutabeak) kalkulatu behar dira. Horiekin, Giniren koefizientea kalkulatzen da.

Errenta Errenta metatuak pi (pertsonen proportzioa) qi (errentaren proportzioa) pi-pi-1 qi+qi-1 (pi-pi-1)(qi+qi-1)
2 2 0.25 2/20=0.1 0.25 0.10 0.025
3 5 0.50 5/20=0.25 0.25 0.35 0.0875
5 10 0.75 10/20=0.5 0.25 0.75 0.1875
10 20 1 20/20=1 0.25 1.5 0.375
20 0.325

Giniren koefizientearen aukerako adierazpenak[aldatu | aldatu iturburu kodea]

Adierazpen sinple bat[aldatu | aldatu iturburu kodea]

Aurreko adierazpenaz gainera, Ginik berak koefizientearen adierazpen labur eta sinple hau ere proposatu zuen:[3][4]

G=\frac{\sum_{i=1}^{n-1}(p_i-q_i)}{\sum_{i=1}^{n-1}p_i}=1-\frac{\sum_{i=1}^{n-1}q_i}{\sum_{i=1}^{n-1}p_i}

Adierazpenak pi eta qi balioen arteko aldeak hartzen ditu kontzentrazio-mailaren erreferentzia moduan, Lorenz kurbaren eta diagoanalren arteko azaleraren ordez. Alde horiek zenbat eta handiagoak izan, orduan eta kontzentrazio handiagoa dago. Izendatzailean, pi balioen baturak pi-qi aldeen baturaren maximoa adierazten du (qi guztiak 0 direnean gertatzen da) eta kontzentrazio handieneko erreferentzia gisa hartzen da. Batura pi,qi guztietarako egiten da, azkenekorako ezik, azkeneko diferentzia beti 0 denez, ez baita kontuan hartzen. Giniren koefizientearen hurbilketa moduan har daiteke eta errore txikia du datu kopurua handia denean.[5].

Aurreko adibideko pi,qi puntuak harturik, honela kalkulatzen da:

G=1-\frac{0.10+0.25+0.50}{0.25+0.50+0.75}=0.44

Emaitza benetako Giniren koefizientearen arrunt desberdina da, datu gutxi baitira.

Giniren koefizientea datuen arteko batez besteko alde moduan[aldatu | aldatu iturburu kodea]

Jatorrian Giniren koefizientea zoriz aukeraturiko bi banakoren errenten artean dagoen batez besteko alde erlatiboaz definitu zen, errentaren batezbestekoarekiko, sakabanatze-neurri moduan. Zehatzago, \Delta\, batez besteko aldea edo zoriz aukeraturiko bi banakoen balioen arteko aldearen batezbestekoa eta \overline{x} batezbesteko aritmetiko sinplea izanik honela kalkulatzen da Giniren koefizientea:[ohar 1][6]


\begin{align}
G =\frac{\Delta}{2\overline{x}} & =\frac{\sum_{i=1}^n\sum_{j=1}^n|x_i-x_j|}{2n^2\overline{x}}\\
& = \frac{\sum_{i=1}^n(2i-n-1)x_i^*}{n^2\overline{x}} ;\ \  x_i^*\ datu\ ordenatuak\ izanik\\
\end{align}


Lehen adierazpenerako kalkuluak dira honako hauek:

Kenketa absolutuak 2 3 5 10
2 0 1 3 8
3 1 0 2 7
5 3 2 0 5
10 8 7 5 0
\sum x_i=20 \sum |x_i-2|=12 \sum |x_i-3|=10 \sum |x_i-5|=10 \sum |x_i-10|=20

G =\frac{\sum_{i=1}^n\sum_{j=1}^n|x_i-x_j|}{2n^2\overline{x}}=\frac{12+10+10+20}{2 \times 4^2 \times \frac{20}{4}}=0.325


Bigarren adierazpena kalkulatzeko:


G = \frac{\sum_{i=1}^n(2i-n-1)x_i^*}{n^2\overline{x}}=\frac{(2 \times 1 -4-1) \times 2 + (2 \times 2 -4-1) \times 3 + (2 \times 3 -4-1) \times 5 + (2 \times 4 -4-1) \times 10}{4^2 \times \frac{20}{4}}=0.325

Emaitza berdina da bietan, noski. Honela interpretatzen da: Giniren koefizientea 0.325 bada, bi banakoren arteko errenten batez besteko aldea banako guztien batez besteko errentaren 0.325×2=%65 da.

Gini koefizientea kobariantza moduan[aldatu | aldatu iturburu kodea]

Giniren koefizientea x datuen eta horiei dagokien banaketa-funtzio enpirikoaren F(x) balioen arteko kobariantza moduan ere kalkula daiteke:[2]

G=\frac{2cov(x,F(x))}{\overline{x}}

Adibideko datuak harturik:

Errentak (x) Banaketa-funtzioa (F(x)) x-\overline{x} F(x)-\overline{F(x)} (x-\overline{x})(F(x)-\overline{F(x)})
2 0.25 2-5=-3 0.25-0.625=-0.375 1.125
3 0.50 3-5=-2 0.5-0.625=-0.125 0.250
5 0.75 5-5=0 0.75-0.625=0.125 0.000
10 1 10-5=5 1-0.625=0.375 1.875
\overline{x}=\frac{20}{4}=5 \overline{F(x)}=\frac{2.5}{4}=0.625 3.25
G=\frac{2cov(x,F(x))}{\overline{x}}=\frac{2 \times \frac{3.25}{4}}{5}=0.325

Oharrak[aldatu | aldatu iturburu kodea]

  1. Bi banakoak aukeratzerakoan, bi aldietan banako berdina suerta daitezkeela hartzen da kontuan. Multzo batetik bi banako aukeratzeko era kopurua n×n=n² da.

Erreferentziak[aldatu | aldatu iturburu kodea]

  1. (Ingelesez)   Goerlich Gisbert, Francisco J.; Lasso de la Vega, Mª Casilda; Marta Urrutia, Ana (2010), Generalizing the S-Gini family.Some properties., http://www.ecineq.org/milano/WP/ECINEQ2010-170.pdf .
  2. a b (Ingelesez)   Bellù, Lorenzo Giovanni; Liberati, Paolo (2006), «Inequality Analysis : The Gini Index», FAO: EASYPol Module 040, http://www.fao.org/docs/up/easypol/329/gini_index_040en.pdf .
  3. (Gaztelaniaz)   Gini, Corrado (1953), Curso de estadística .
  4. (Ingelesez)   Basulto Santos, Jesús; Busto Guerrero, J. Javier (2010eko ekaina), «Gini's concentration ratio (1908-1914)», Journ@l Electronique d’Histoire des Probabilités et de la Statistique .
  5. (Gaztelaniaz)   Ferreira, Eva; Garín, Araceli (1997), «Una nota sobre el cálculo del índice de Gini», Estadística Española 39 (142): 207-218 .
  6. (Ingelesez)   Damgaard, Christian, «"Gini Coefficient."», MathWorld--A Wolfram Web Resource, created by Eric W. Weisstein, http://mathworld.wolfram.com/GiniCoefficient.html. Noiz kontsultatua: 2013-11-07 .

Kanpo loturak[aldatu | aldatu iturburu kodea]

Commonsen badira fitxategi gehiago, gai hau dutenak: Giniren koefiziente Aldatu lotura Wikidatan