Gini koefficient betydning
Gini-koefficienten er et statistisk mål for ulighed i en fordeling, typisk brugt til at beskrive, hvor ujævnt indkomst eller formue er fordelt i en befolkning
Værdien ligger mellem 0 (perfekt lighed) og 1 (maksimal ulighed).
Betydning og definition
Gini-koefficienten kvantificerer afstanden mellem den observerede fordeling og perfekt lighed. Den bygger på Lorenz-kurven, som viser den kumulerede andel af indkomst (eller en anden størrelse) for den kumulerede andel af befolkningen, sorteret fra fattigst til rigest.
Geometrisk er Gini-koefficienten arealet mellem lighedslinjen (45°-linjen) og Lorenz-kurven, divideret med det totale areal under lighedslinjen. Algebraisk kan den for en diskret fordeling skrives som:
G = 1 − 2 ∫01 L(p) dp (kontinuert), eller G = [1 / (2 n2 μ)] ∑∑ |xi − xj| (diskret), hvor n er antal observationer, μ gennemsnittet og xi observationerne.
Etymologi og navngivning
Begrebet er opkaldt efter den italienske statistiker Corrado Gini, der introducerede det i 1912 i artiklen “Variabilità e mutabilità”. På dansk ses både Gini-koefficient, Gini-indeks og i daglig tale Gini-tallet. På engelsk: Gini coefficient eller Gini index.
Matematiske definitioner og beregning
- Lorenz-baseret: Tegn Lorenz-kurven L(p) for p i [0,1]. G = 1 − 2 × (arealet under L(p)).
- Parvis forskel: G = [1 / (2 n2 μ)] ∑i=1n ∑j=1n |xi − xj|.
- Sorteringsformel (praktisk): Sortér x stigende, beregn kumulative andele og brug trapezreglen til arealet under Lorenz-kurven.
Trinvis beregning (eksempel):
- Data (indkomst): [20, 20, 40, 80, 140]. Sum = 300, n = 5, μ = 60.
- Kumulative andele af befolkning (p): 0, 0.2, 0.4, 0.6, 0.8, 1.0.
- Kumulative andele af indkomst (L): 0, 0.0667, 0.1333, 0.2667, 0.5333, 1.0.
- Areal under Lorenz-kurven (trapezer): 0.3000.
- G = 1 − 2 × 0.3000 = 0.40.
| Kumulativ befolkning | Kumulativ indkomst |
|---|---|
| 0.0 | 0.0000 |
| 0.2 | 0.0667 |
| 0.4 | 0.1333 |
| 0.6 | 0.2667 |
| 0.8 | 0.5333 |
| 1.0 | 1.0000 |
Fortolkning og typiske niveauer
Skalaen går fra 0 til 1 (ofte angivet fra 0 til 100 i procent).
| Gini-niveau | Fortolkning |
|---|---|
| 0.00 | Perfekt lighed: alle har samme indkomst/formue. |
| 0.10-0.25 | Lav ulighed. |
| 0.25-0.35 | Moderat ulighed. |
| 0.35-0.45 | Relativt høj ulighed. |
| 0.45-0.60+ | Høj til meget høj ulighed (især almindelig for formue). |
| 1.00 | Maksimal ulighed: én har alt, andre intet. |
Bemærk: Den samme Gini-værdi kan opstå fra meget forskellige fordelingsmønstre.
Anvendelser
- Økonomi og offentlig politik: Indkomst- og formuefordeling, før/efter skat og overførsler.
- Udviklingsstudier: Sammenligning af ulighed mellem lande og over tid.
- Byforskning: Ulighed mellem kvarterer/bydele.
- Sundhed: Ulighed i levealder, adgang til sundhed, sygdomsbyrde.
- Miljø: Fordeling af CO₂-udledninger eller energiforbrug.
- Virksomheder: Lønspredning internt i organisationer.
Eksempler på brug
- “Landets Gini-koefficient for disponibel indkomst faldt fra 0,31 til 0,29 efter skattereformen.”
- “Formue-Gini er markant højere end indkomst-Gini, hvilket afspejler stærkere koncentration af aktiver.”
- “Justering for husholdningsstørrelse via OECD’s ækvivalensskala reducerer Gini en smule.”
- “Under højkonjunkturen steg Gini, drevet af hurtigere indkomstvækst i toppen.”
- “Kommunens Gini indikerer større ulighed i bykernen end i forstæderne.”
- “Når vi måler før skat (markedsindkomst), er Gini 0,40; efter skat og overførsler er den 0,28.”
- “Målt på forbrug frem for indkomst er Gini lavere, fordi forbrug udjævnes over livsforløbet.”
- “En stigning i S80/S20-ratioen ledsages ofte af en stigende Gini.”
Synonymer og beslægtede termer
- Synonymer: Gini-koefficient, Gini-indeks, Gini-tallet.
-
Beslægtede ulighedsmål:
- Lorenz-kurven (grafisk grundlag for Gini).
- Palma-ratio (indkomstandel for top 10% i forhold til bund 40%).
- Hoover-/Robin Hood-indeks (maksimal lodret afstand mellem Lorenz og lighedslinje).
- Theil-indeks og Atkinson-indeks (dekomponérbare, følsomhedsparametre).
- S80/S20-ratio (top 20% i forhold til bund 20%).
Antonymer og kontrastbegreber
Der findes ikke et standardiseret “antonym” til Gini-koefficienten. Nogle bruger et lighedsindeks defineret som 1 − Gini (eller 100 − Gini i procent), som stiger med lighed. Konceptuelt står “perfekt lighed” i kontrast til ulighedsmål generelt.
Styrker og begrænsninger
- Styrker: Skala-invariant (uafhængig af enhedsvalg), enkel at kommunikere, anvendelig på mange fordelinger.
-
Begrænsninger:
- Ikke fuldt dekomponérbar på samme måde som Theil/Atkinson (sværere at splitte i “inden for” og “mellem”-ulighed).
- Samme Gini kan dække over forskellige fordelingsformer (fx koncentration i top vs. bund).
- Ikke translation-invariant (tilføjelse af samme beløb til alle ændrer Gini).
- Følsom for datakvalitet: top-censorering, skyggeøkonomi, nul/negative indkomster.
Historisk udvikling og brug i praksis
Siden 1912 er Gini-koefficienten blevet standard i ulighedsanalyser. Internationale organisationer (fx statistikmyndigheder, forskningsinstitutioner) publicerer tidsserier for indkomst og formue med justeringer for skatter, overførsler og husholdningsstørrelse. I de fleste lande ligger indkomst-Gini typisk i intervallet ca. 0,25-0,50, mens formue-Gini ofte er højere.
Ofte forvekslede begreber
- Gini-koefficient vs. Gini-impurity: I maskinlæring bruges “Gini impurity” ved beslutningstræer til at måle klassifikationsrenhed. Det er et andet mål end uligheds-Gini, selv om navnene er beslægtede.
- “Indeks” vs. “koefficient”: I ulighedslitteraturen bruges de ofte synonymt; i ML betyder “Gini index” typisk impurity.
Praktiske metodevalg og datanoter
- Indkomstopgørelse: Markedsindkomst vs. disponibel indkomst (efter skat/overførsler).
- Ækvivalering: Justering for husholdningsstørrelse (fx OECD-modificeret skala) ændrer Gini.
- Prisniveau og tid: Deflation (reelle termer) og PPP-justering ved landesammenligning.
- Dataproblemer: Top-kodning, underdækning af højindkomster, ikke-rapportering, negative værdier.
- Population: Individ vs. husholdning, vægtning med stikprøvevægte.
“Tommelfingerregler” for fortolkning
- Sammenlign altid “æbler med æbler” (samme indkomstbegreb, periode, population, ækvivalering).
- Brug supplerende mål (Palma, S80/S20, Theil) for at forstå, hvor i fordelingen uligheden ligger.
- Kig på Lorenz-kurven for visuel diagnosticering af forskelle, selv når Gini er ens.
Se også
- Lorenz-kurve
- Palma-ratio
- Hoover-/Robin Hood-indeks
- Theil-indeks
- Atkinson-indeks
- S80/S20-ratio
- Gini-impurity (maskinlæring)
Indholdsfortegnelse
- Betydning og definition
- Etymologi og navngivning
- Matematiske definitioner og beregning
- Fortolkning og typiske niveauer
- Anvendelser
- Eksempler på brug
- Synonymer og beslægtede termer
- Antonymer og kontrastbegreber
- Styrker og begrænsninger
- Historisk udvikling og brug i praksis
- Ofte forvekslede begreber
- Praktiske metodevalg og datanoter
- “Tommelfingerregler” for fortolkning
- Se også