Giniren koefiziente

Estatistikan, Giniren koefizientea errentaren desberdintasunaren neurketarako eta beste aldagaien kontzentrazioa neurtzen duen koefiziente bat da. Sakabanatze neurri moduan asmatu bazen ere, kontzentrazioa aztertzeko erabiltzen den Lorenzen kurbarekin loturik dagoen formulazioa ezagunena da. Giniren koefizienteak 0tik 1era bitarteko balioak hartzen ditu: 0 erabateko berdintasuna da (denek diru-sarrera berak dituzte) eta 1, erabateko kontzentrazioa (batek diru-sarrera guztiak ditu; besteek, bat ere ez); horrela, zenbat eta handiagoa izan, banaketan hainbat eta kontzentrazio edo desberdintasun handiagoa dagoela ondorioztatzen da.

Errenta-banaketaz gainera, beste hainbat aldagai sozioekonomikoen kontzentraziorako erabiltzen da, hala nola, osasunarekin eta hezkuntzarekin loturik. Bestelako aldagaietarako ere erabiltzen da, Wikipedian egiten diren ekarpenen kontzentrazioa, lankideen artean, kasu. Kontzentrazioaz gainera, beste ezaugarri batzuk neurtzeko ere erabili izan da. Koefizientea Corrado Gini italiar estatistikariak asmatu zuen 1912an eta, egun, desberdintasun ekonomikoa aztertzeko, praktikan gehien erabilitako koefizientea da.^[1]

Giniren koefizientea eta Lorenzen kurba[aldatu | aldatu iturburu kodea]

Ohiko formulazioan, **Giniren koefizientea** diagonaletik Lorenzen kurbara dagoen azalera erlatiboa da, diagonal azpiko azalera osoarekiko. Diagonal azpiko azalera 1/2 da. Beraz, diagonaletik Lorenzen kurbara dagoen azalera 1/2 ken Lorenzen kurbaren azpitik dagoen azalera da. Irudian, Lorenzen kurbako zati horietako bat agertzen da. Haren azalera honela kalkulatzen da: OACE = (OADE + OBCE)/2=[(p_i-1-p_i)q_i-1+ (p_i-1-p_i)q_i]/2. Zati bakoitzeko azalera horrela kalkulaturik, 1/2 ken zati guztietako azaleren batura kalkulatzen da. Lorenzen kurbatik diagonalera dagoen azalera kalkulatzeko. Koefizientea normalizatzeko, emaitza azalera maximoarekin, hots, diagonal azpiko azalera osoarekin (1/2) zatitzen da.

Ohiko formulazioan, Giniren koefizientea Lorenz kurbarekin loturik dago. Lorenz kurbak banako guztien arteko kontzentrazioaren egitura osoa adierazten du, banako ehuneko pobreen orok (p_i) errenta osotik hartzen duen proportzioa (q_i) zehaztuz. Berdintasun-egoera adierazten duen diagonaletik zenbat eta urrunago egon, kontzentrazioa hainbat eta handiagoa da. Horrela, Lorenz kurbaren eta diagonalaren arteko azalera har daiteke kontzentrazio-neurri moduan. 0 eta 1 arteko balioak har ditzan, azalera hori kontzentrazio handieneko azalerarekin (irudian, a+b azalera, Lorenz kurbaren ardatzak 0 eta 1 bitartekoak direla kontuan hartuz, 1/2 balio duena) zatitzen da. Zatiketa horren emaitza da Giniren koefizientea:^[2]

G={\frac {a}{a+b}}={\frac {a}{\frac {1}{2}}}=2a=2(a+b-b)=2(a+b)-2b=2\times {\frac {1}{2}}-2b=1-2b

Kontzentrazioa datuetatik egiten denean, Lorenz kurba osatzen duten p_i,q_i puntuak (ehuneko metatua banako kopuruari buruz eta ehuneko metatua totalari buruz, hurrenez hurren) erabiltzen dira Giniren koefizientea kalkulatzeko. Puntu horietatik Giniren koefizientea, azalera moduan, zehaztasunez kalkulatzen duen adierazpena hau da:

G={\frac {{\frac {1}{2}}-{\frac {\sum _{i=1}^{n}(p_{i}-p_{i-1})q_{i}+\sum _{i=1}^{n}(p_{i}-p_{i-1})q_{i-1}}{2}}}{2}}=1-\sum _{i=1}^{n}(p_{i}-p_{i-1})(q_{i}+q_{i-1})

Adibidea[aldatu | aldatu iturburu kodea]

Zenbait pertsonaren errentak jaso dira: 2-3-5-10 (moneta-unitatetan). Datuak ordenaturik (1. zutabea), Lorenz kurbako p_i eta q_i puntuak (3. eta 4. zutabeak) kalkulatu behar dira. Horiekin, Giniren koefizientea kalkulatzen da.

Errenta	Errenta metatuak	p_i (pertsonen proportzioa)	q_i (errentaren proportzioa)	p_i-p_i-1	q_i+q_i-1	(p_i-p_i-1)(q_i+q_i-1)
2	2	0.25	2/20=0.1	0.25	0.10	0.025
3	5	0.50	5/20=0.25	0.25	0.35	0.0875
5	10	0.75	10/20=0.5	0.25	0.75	0.1875
10	20	1	20/20=1	0.25	1.5	0.375
20						0.325

Giniren koefizientearen aukerako adierazpenak[aldatu | aldatu iturburu kodea]

Adierazpen sinple bat[aldatu | aldatu iturburu kodea]

Aurreko adierazpenaz gainera, Ginik berak koefizientearen adierazpen labur eta sinple hau ere proposatu zuen:^[3]^[4]

G={\frac {\sum _{i=1}^{n-1}(p_{i}-q_{i})}{\sum _{i=1}^{n-1}p_{i}}}=1-{\frac {\sum _{i=1}^{n-1}q_{i}}{\sum _{i=1}^{n-1}p_{i}}}

Adierazpenak p_i eta q_i balioen arteko aldeak hartzen ditu kontzentrazio-mailaren erreferentzia moduan, Lorenz kurbaren eta diagoanalaren arteko azaleraren ordez. Alde horiek zenbat eta handiagoak izan, hainbat eta kontzentrazio handiagoa dago. Izendatzailean, p_i balioen baturak p_i-q_i aldeen baturaren maximoa adierazten du (q_i guztiak 0 direnean gertatzen da) eta kontzentrazio handieneko erreferentzia gisa hartzen da. Batura p_i,q_i guztietarako egiten da, azkenekorako ezik, azkeneko diferentzia beti 0 denez, ez baita kontuan hartzen. Giniren koefizientearen hurbilketa moduan har daiteke eta errore txikia du datu kopurua handia denean.^[5].

Aurreko adibideko p_i,q_i puntuak harturik, honela kalkulatzen da:

G=1-{\frac {0.10+0.25+0.50}{0.25+0.50+0.75}}=0.44

Emaitza benetako Giniren koefizientearen arrunt desberdina da, datu gutxi baitira.

Giniren koefizientea datuen arteko batez besteko alde moduan[aldatu | aldatu iturburu kodea]

Jatorrian Giniren koefizientea zoriz aukeraturiko bi banakoren errenten artean dagoen batez besteko alde erlatiboaz definitu zen, errentaren batezbestekoarekiko, sakabanatze-neurri moduan. Zehatzago, $\Delta \,$ batez besteko aldea edo ausaz aukeraturiko bi banakoen balioen arteko aldearen batezbestekoa eta ${\overline {x}}$ batezbesteko aritmetiko sinplea izanik honela kalkulatzen da Giniren koefizientea:^{[ohar 1]}^[6]

{\begin{aligned}G={\frac {\Delta }{2{\overline {x}}}}&={\frac {\sum _{i=1}^{n}\sum _{j=1}^{n}|x_{i}-x_{j}|}{2n^{2}{\overline {x}}}}\\&={\frac {\sum _{i=1}^{n}(2i-n-1)x_{i}^{*}}{n^{2}{\overline {x}}}};\ \ x_{i}^{*}\ datu\ ordenatuak\ izanik\\\end{aligned}}

Lehen adierazpenerako kalkuluak dira honako hauek:

$\sum x_{i}=20$	$\sum \|x_{i}-2\|=12$	$\sum \|x_{i}-3\|=10$	$\sum \|x_{i}-5\|=10$	$\sum \|x_{i}-10\|=20$
Kenketa absolutuak	2	3	5	10
2	0	1	3	8
3	1	0	2	7
5	3	2	0	5
10	8	7	5	0

G={\frac {\sum _{i=1}^{n}\sum _{j=1}^{n}|x_{i}-x_{j}|}{2n^{2}{\overline {x}}}}={\frac {12+10+10+20}{2\times 4^{2}\times {\frac {20}{4}}}}=0.325

Bigarren adierazpena kalkulatzeko:

G={\frac {\sum _{i=1}^{n}(2i-n-1)x_{i}^{*}}{n^{2}{\overline {x}}}}={\frac {(2\times 1-4-1)\times 2+(2\times 2-4-1)\times 3+(2\times 3-4-1)\times 5+(2\times 4-4-1)\times 10}{4^{2}\times {\frac {20}{4}}}}=0.325

Emaitza bera da bietan, noski. Honela interpretatzen da: Giniren koefizientea 0,325 bada, bi banakoren arteko errenten batez besteko aldea banako guztien batez besteko errentaren 0,325 × 2 = % 65 da.

Gini koefizientea kobariantza moduan[aldatu | aldatu iturburu kodea]

Giniren koefizientea x datuen eta horiei dagokien banaketa-funtzio enpirikoaren F(x) balioen arteko kobariantza moduan ere kalkula daiteke:^[2]

G={\frac {2cov(x,F(x))}{\overline {x}}}

Adibideko datuak harturik:

Errentak (x)	Banaketa-funtzioa (F(x))	$x-{\overline {x}}$	$F(x)-{\overline {F(x)}}$	$(x-{\overline {x}})(F(x)-{\overline {F(x)}})$
2	0.25	2-5=-3	0.25-0.625=-0.375	1.125
3	0.50	3-5=-2	0.5-0.625=-0.125	0.250
5	0.75	5-5=0	0.75-0.625=0.125	0.000
10	1	10-5=5	1-0.625=0.375	1.875
${\overline {x}}={\frac {20}{4}}=5$	${\overline {F(x)}}={\frac {2.5}{4}}=0.625$			3.25

G={\frac {2cov(x,F(x))}{\overline {x}}}={\frac {2\times {\frac {3.25}{4}}}{5}}=0.325

Oharrak[aldatu | aldatu iturburu kodea]

↑ Bi banakoak aukeratzerakoan, bi aldietan banako berdina suerta daitezkeela hartzen da kontuan. Multzo batetik bi banako aukeratzeko era kopurua n×n=n² da.

Erreferentziak[aldatu | aldatu iturburu kodea]

↑ (Ingelesez) Goerlich Gisbert, Francisco J.; Lasso de la Vega, Mª Casilda; Marta Urrutia, Ana. (2010). Generalizing the S-Gini family.Some properties.. .
↑ ^a ^b (Ingelesez) Bellù, Lorenzo Giovanni; Liberati, Paolo. (2006). «Inequality Analysis : The Gini Index» FAO: EASYPol Module 040.
↑ (Gaztelaniaz) Gini, Corrado. (1953). Curso de estadística. .
↑ (Ingelesez) Basulto Santos, Jesús; Busto Guerrero, J. Javier. (2010eko ekaina). «Gini's concentration ratio (1908-1914)» Journ@l Electronique d’Histoire des Probabilités et de la Statistique.
↑ (Gaztelaniaz) Ferreira, Eva; Garín, Araceli. (1997). «Una nota sobre el cálculo del índice de Gini» Estadística Española 39 (142): 207-218..
↑ (Ingelesez) Damgaard, Christian. «"Gini Coefficient."» MathWorld--A Wolfram Web Resource, created by Eric W. Weisstein (Noiz kontsultatua: 2013-11-07).

Kanpo estekak[aldatu | aldatu iturburu kodea]

Datuak: Q162455
Multimedia: Gini coefficient / Q162455

[6] Bi banakoak aukeratzerakoan, bi aldietan banako berdina suerta daitezkeela hartzen da kontuan. Multzo batetik bi banako aukeratzeko era kopurua n×n=n² da.

[1] (Ingelesez) Goerlich Gisbert, Francisco J.; Lasso de la Vega, Mª Casilda; Marta Urrutia, Ana. (2010). Generalizing the S-Gini family.Some properties.. .

[fao-2] (Ingelesez) Bellù, Lorenzo Giovanni; Liberati, Paolo. (2006). «Inequality Analysis : The Gini Index» FAO: EASYPol Module 040.

[3] (Gaztelaniaz) Gini, Corrado. (1953). Curso de estadística. .

[4] (Ingelesez) Basulto Santos, Jesús; Busto Guerrero, J. Javier. (2010eko ekaina). «Gini's concentration ratio (1908-1914)» Journ@l Electronique d’Histoire des Probabilités et de la Statistique.

[5] (Gaztelaniaz) Ferreira, Eva; Garín, Araceli. (1997). «Una nota sobre el cálculo del índice de Gini» Estadística Española 39 (142): 207-218..

[7] (Ingelesez) Damgaard, Christian. «"Gini Coefficient."» MathWorld--A Wolfram Web Resource, created by Eric W. Weisstein (Noiz kontsultatua: 2013-11-07).

[1]

[2]

[3]

[4]

[5]

[ohar 1]

[6]