Median betydning
Median betyder den “midterste” værdi
I statistik er medianen det tal, der deler en sorteret datamængde i to lige store halvdele, så halvdelen af observationerne ligger under eller lig med medianen, og halvdelen ligger over eller lig med den. Uden for statistikken bruges ordet også i geometri (median i en trekant), i medicin/anatomi (f.eks. nervus medianus) og i trafikal sammenhæng (midterrabat), men den statistiske betydning er den mest udbredte i daglig tale.
Betydning og kort definition
Statistik: Givet en samling tal, sorteret i ikke-faldende orden, er medianen:
- Ved ulige antal observationer n: den midterste observation (placering (n+1)/2).
- Ved lige antal observationer n: gennemsnittet af de to midterste observationer (placeringer n/2 og n/2+1).
Medianen er et mål for central tendens, ligesom middelværdi (gennemsnit) og typetal (mode), men er langt mere robust over for ekstreme værdier (outliers).
Etymologi og sproglig oprindelse
Ordet stammer fra latin medianus (“i midten”) afledt af medius (“midt”). Den statistiske term median blev populariseret i 1800-tallet, især gennem Francis Galton (ca. 1881), mens den geometriske brug (linjestykket fra et trekantshjørne til midtpunktet af den modstående side) går tilbage til klassisk geometri. På dansk har “median” både en teknisk statistisk og geometrisk betydning; i trafikken bruges typisk “midterrabat” frem for det engelske “median strip”.
Relaterede betydninger i andre fag
- Geometri: En trekants median er linjen fra et hjørne til midtpunktet af den modstående side. De tre medianer skærer hinanden i trekantens tyngdepunkt.
- Medicin/anatomi: “Median” kan betyde “i midtplanet” (medianplan). Nervus medianus er den mediane nerve i armen.
- Trafik/vej: Midterrabat (eng. median) adskiller modkørende kørefelter.
Sådan beregnes medianen
- Diskrete data (ubearbejdede): Sortér tallene. Vælg den midterste (ulige n) eller gennemsnittet af de to midterste (lige n).
- Grupperede data (klasser): Find den klasse hvis kumulerede frekvens først overstiger n/2. Approksimér: median ≈ L + ((n/2 − Fforud)/fklasse) · h, hvor L er klassens nedre grænse, h er klassebredden.
- Vægtet median: Sortér observationer med vægte; medianen er det punkt hvor de kumulerede vægte passerer 50%.
- Kontinuerte fordelinger: Median m opfylder P(X ≤ m) = 0,5.
- Algoritmer: Effektiv udpegning kan ske i forventet lineær tid (Quickselect); den deterministiske “median-of-medians” giver lineær værste-faldstid.
Egenskaber og hvorfor medianen er nyttig
- Robusthed: Har et “breakdown point” på 50%: op til halvdelen af data kan være ekstreme uden at medianen divergerer. Den minimerer summen af (vægtede) absolutte afvigelser.
- Skævhedstolerant: I skæve fordelinger (fx indkomster) giver medianen ofte et mere “typisk” tal end gennemsnittet.
- Transformationer: For monotont stigende transformationer g gælder typisk: median(g(X)) = g(median(X)).
- Forhold til kvartiler: Medianen er 2. kvartil (Q2), og bruges sammen med Q1 og Q3 til at beskrive fordelingen (fx boksplot og interkvartilafstand).
Eksempler på brug
- Indkomst: Data: 240, 250, 255, 260, 265, 270, 5000 (tusind kr.). Middelværdi ≈ 964, men median = 260. Medianen beskriver “typisk” indkomst langt bedre her.
- Huspriser: 2,1; 2,2; 2,3; 2,4; 15,0 mio. Median = 2,3 mio.; gennemsnit ≈ 4,8 mio. Medianen bruges ofte i boligstatistik.
- Ventetider: 5, 6, 7, 30 min. Median = (6+7)/2 = 6,5 min. En enkelt meget lang ventetid trækker ikke medianen voldsomt.
- Overlevelsestid (medicin): “Median overlevelse på 18 måneder” betyder, at 50% af patienterne forventes at leve mindst 18 måneder efter opstart.
- Brugerundersøgelser (Likert): Svar: 1, 2, 3, 3, 4, 5 → median = 3. Medianen er velegnet til ordinalskalaer.
- Billedbehandling: Medianfiltre fjerner “salt-og-peber”-støj ved at erstatte en pixels værdi med medianen i et lokalt vindue.
Sammenligning: median, middelværdi og typetal
| Egenskab | Median | Middelværdi (gennemsnit) | Typetal (mode) |
|---|---|---|---|
| Robust mod outliers | Høj | Lav | Høj |
| Data-niveau | Ordinal og op | Interval/ratio | Nominal og op |
| Geometrisk intuition | Midterste værdi | Balancerer massen | Hyppigste værdi |
| I normalfordeling | = mean = mode | = median = mode | = mean = median |
| Skæve fordelinger | Liggende nær “typisk” | Trukket mod halen | Kan være flertydig |
Synonymer, nært beslægtede udtryk og antonymer
- Synonymer (kontekstafhængige): Den midterste værdi; 2. kvartil; 50%-percentilen.
- Beslægtede termer: Middelværdi (gennemsnit), typetal, kvartiler (Q1, Q3), percentiler, median absolut afvigelse (MAD), interkvartilafstand (IQR), trimmet gennemsnit, geometrisk median.
- Antonymer (kun løst): Minimum og maksimum repræsenterer fordelingens ekstreme “ender” frem for midten.
Historisk udvikling
Idéen om en “midt-værdi” findes implicit i ældre statistik og geometri. I moderne statistik populariserede Francis Galton betegnelsen “median” i slutningen af 1800-tallet som et robust centrumsmål. Gennem 1900-tallet blev medianen standard i officiel statistik til skæve størrelser som indkomst, boligpriser og ventetider. I samme periode blev medianen central i robust statistik (f.eks. median + MAD) og fik algoritmisk opmærksomhed med lineære selektionsalgoritmer.
Almindelige misforståelser og faldgruber
- “Medianen er altid en observeret værdi”: Ikke nødvendigvis; ved lige n er medianen ofte gennemsnittet af to midterste tal.
- “Medianen kan bruges på alle datatyper”: Den kræver mindst ordinalt niveau; den giver ikke mening for rene navnekategorier uden orden.
- “Vægtning er lig med gennemsnit”: En vægtet median er ikke det samme som et vægtet gennemsnit; vægte bruges på kumulerede andele, ikke på summer.
- “Samme median = samme fordeling”: Forskellige fordelinger kan have samme median; man bør også se på spredning (IQR, MAD) og form.
Relaterede mål og udvidelser
- Percentiler og kvartiler: Medianen er 50. percentil; sammen med Q1 og Q3 beskriver den fordelingens midte og spredning.
- Median absolut afvigelse (MAD): Robust spredningsmål defineret som medianen af |X − median(X)|.
- Geometrisk median: Det punkt i rummet der minimerer summen af afstande til alle punkter (Fermat-Weber-problem).
- Median-of-means: Robust estimationsmetode, der kombinerer delgennemsnit via median for at modstå outliers.
- Løbende/”rolling” median: Anvendes i tidsrækker og filtrering til at udglatte støj uden at blive draget af spidser.
Praktiske råd
- Brug medianen ved skæve fordelinger og når outliers forventes.
- Kombinér median med IQR/MAD for en robust, kortfattet beskrivelse.
- Rapportér både median og n (evt. også kvartiler) for transparens.
- Vælg vægtet median, når observationer repræsenterer forskellige populationstørrelser.
Indholdsfortegnelse
- Betydning og kort definition
- Etymologi og sproglig oprindelse
- Relaterede betydninger i andre fag
- Sådan beregnes medianen
- Egenskaber og hvorfor medianen er nyttig
- Eksempler på brug
- Sammenligning: median, middelværdi og typetal
- Synonymer, nært beslægtede udtryk og antonymer
- Historisk udvikling
- Almindelige misforståelser og faldgruber
- Relaterede mål og udvidelser
- Praktiske råd