Gini koefficient betydning

Gini-koefficienten er et statistisk mål for ulighed i en fordeling, typisk brugt til at beskrive, hvor ujævnt indkomst eller formue er fordelt i en befolkning

Værdien ligger mellem 0 (perfekt lighed) og 1 (maksimal ulighed).


Betydning og definition

Gini-koefficienten kvantificerer afstanden mellem den observerede fordeling og perfekt lighed. Den bygger på Lorenz-kurven, som viser den kumulerede andel af indkomst (eller en anden størrelse) for den kumulerede andel af befolkningen, sorteret fra fattigst til rigest.

Geometrisk er Gini-koefficienten arealet mellem lighedslinjen (45°-linjen) og Lorenz-kurven, divideret med det totale areal under lighedslinjen. Algebraisk kan den for en diskret fordeling skrives som:

G = 1 − 2 ∫01 L(p) dp (kontinuert), eller G = [1 / (2 n2 μ)] ∑∑ |xi − xj| (diskret), hvor n er antal observationer, μ gennemsnittet og xi observationerne.


Etymologi og navngivning

Begrebet er opkaldt efter den italienske statistiker Corrado Gini, der introducerede det i 1912 i artiklen “Variabilità e mutabilità”. På dansk ses både Gini-koefficient, Gini-indeks og i daglig tale Gini-tallet. På engelsk: Gini coefficient eller Gini index.


Matematiske definitioner og beregning

  • Lorenz-baseret: Tegn Lorenz-kurven L(p) for p i [0,1]. G = 1 − 2 × (arealet under L(p)).
  • Parvis forskel: G = [1 / (2 n2 μ)] ∑i=1nj=1n |xi − xj|.
  • Sorteringsformel (praktisk): Sortér x stigende, beregn kumulative andele og brug trapezreglen til arealet under Lorenz-kurven.

Trinvis beregning (eksempel):

  1. Data (indkomst): [20, 20, 40, 80, 140]. Sum = 300, n = 5, μ = 60.
  2. Kumulative andele af befolkning (p): 0, 0.2, 0.4, 0.6, 0.8, 1.0.
  3. Kumulative andele af indkomst (L): 0, 0.0667, 0.1333, 0.2667, 0.5333, 1.0.
  4. Areal under Lorenz-kurven (trapezer): 0.3000.
  5. G = 1 − 2 × 0.3000 = 0.40.

Kumulativ befolkning Kumulativ indkomst
0.0 0.0000
0.2 0.0667
0.4 0.1333
0.6 0.2667
0.8 0.5333
1.0 1.0000

Fortolkning og typiske niveauer

Skalaen går fra 0 til 1 (ofte angivet fra 0 til 100 i procent).

Gini-niveau Fortolkning
0.00 Perfekt lighed: alle har samme indkomst/formue.
0.10-0.25 Lav ulighed.
0.25-0.35 Moderat ulighed.
0.35-0.45 Relativt høj ulighed.
0.45-0.60+ Høj til meget høj ulighed (især almindelig for formue).
1.00 Maksimal ulighed: én har alt, andre intet.

Bemærk: Den samme Gini-værdi kan opstå fra meget forskellige fordelingsmønstre.


Anvendelser

  • Økonomi og offentlig politik: Indkomst- og formuefordeling, før/efter skat og overførsler.
  • Udviklingsstudier: Sammenligning af ulighed mellem lande og over tid.
  • Byforskning: Ulighed mellem kvarterer/bydele.
  • Sundhed: Ulighed i levealder, adgang til sundhed, sygdomsbyrde.
  • Miljø: Fordeling af CO₂-udledninger eller energiforbrug.
  • Virksomheder: Lønspredning internt i organisationer.

Eksempler på brug

  • “Landets Gini-koefficient for disponibel indkomst faldt fra 0,31 til 0,29 efter skattereformen.”
  • “Formue-Gini er markant højere end indkomst-Gini, hvilket afspejler stærkere koncentration af aktiver.”
  • “Justering for husholdningsstørrelse via OECD’s ækvivalensskala reducerer Gini en smule.”
  • “Under højkonjunkturen steg Gini, drevet af hurtigere indkomstvækst i toppen.”
  • “Kommunens Gini indikerer større ulighed i bykernen end i forstæderne.”
  • “Når vi måler før skat (markedsindkomst), er Gini 0,40; efter skat og overførsler er den 0,28.”
  • “Målt på forbrug frem for indkomst er Gini lavere, fordi forbrug udjævnes over livsforløbet.”
  • “En stigning i S80/S20-ratioen ledsages ofte af en stigende Gini.”

Synonymer og beslægtede termer

  • Synonymer: Gini-koefficient, Gini-indeks, Gini-tallet.
  • Beslægtede ulighedsmål:

    • Lorenz-kurven (grafisk grundlag for Gini).
    • Palma-ratio (indkomstandel for top 10% i forhold til bund 40%).
    • Hoover-/Robin Hood-indeks (maksimal lodret afstand mellem Lorenz og lighedslinje).
    • Theil-indeks og Atkinson-indeks (dekomponérbare, følsomhedsparametre).
    • S80/S20-ratio (top 20% i forhold til bund 20%).


Antonymer og kontrastbegreber

Der findes ikke et standardiseret “antonym” til Gini-koefficienten. Nogle bruger et lighedsindeks defineret som 1 − Gini (eller 100 − Gini i procent), som stiger med lighed. Konceptuelt står “perfekt lighed” i kontrast til ulighedsmål generelt.


Styrker og begrænsninger

  • Styrker: Skala-invariant (uafhængig af enhedsvalg), enkel at kommunikere, anvendelig på mange fordelinger.
  • Begrænsninger:

    • Ikke fuldt dekomponérbar på samme måde som Theil/Atkinson (sværere at splitte i “inden for” og “mellem”-ulighed).
    • Samme Gini kan dække over forskellige fordelingsformer (fx koncentration i top vs. bund).
    • Ikke translation-invariant (tilføjelse af samme beløb til alle ændrer Gini).
    • Følsom for datakvalitet: top-censorering, skyggeøkonomi, nul/negative indkomster.


Historisk udvikling og brug i praksis

Siden 1912 er Gini-koefficienten blevet standard i ulighedsanalyser. Internationale organisationer (fx statistikmyndigheder, forskningsinstitutioner) publicerer tidsserier for indkomst og formue med justeringer for skatter, overførsler og husholdningsstørrelse. I de fleste lande ligger indkomst-Gini typisk i intervallet ca. 0,25-0,50, mens formue-Gini ofte er højere.


Ofte forvekslede begreber

  • Gini-koefficient vs. Gini-impurity: I maskinlæring bruges “Gini impurity” ved beslutningstræer til at måle klassifikationsrenhed. Det er et andet mål end uligheds-Gini, selv om navnene er beslægtede.
  • “Indeks” vs. “koefficient”: I ulighedslitteraturen bruges de ofte synonymt; i ML betyder “Gini index” typisk impurity.

Praktiske metodevalg og datanoter

  • Indkomstopgørelse: Markedsindkomst vs. disponibel indkomst (efter skat/overførsler).
  • Ækvivalering: Justering for husholdningsstørrelse (fx OECD-modificeret skala) ændrer Gini.
  • Prisniveau og tid: Deflation (reelle termer) og PPP-justering ved lande­sammenligning.
  • Dataproblemer: Top-kodning, underdækning af højindkomster, ikke-rapportering, negative værdier.
  • Population: Individ vs. husholdning, vægtning med stikprøvevægte.

“Tommelfingerregler” for fortolkning

  • Sammenlign altid “æbler med æbler” (samme indkomstbegreb, periode, population, ækvivalering).
  • Brug supplerende mål (Palma, S80/S20, Theil) for at forstå, hvor i fordelingen uligheden ligger.
  • Kig på Lorenz-kurven for visuel diagnosticering af forskelle, selv når Gini er ens.

Se også

  • Lorenz-kurve
  • Palma-ratio
  • Hoover-/Robin Hood-indeks
  • Theil-indeks
  • Atkinson-indeks
  • S80/S20-ratio
  • Gini-impurity (maskinlæring)