Konfidensinterval betydning
Et konfidensinterval er et intervalestimat omkring en ukendt populationsparameter (fx en middelværdi, en andel eller en risikoratio), som er konstrueret, så fremgangsmåden - i gentagne, hypotetiske gentagelser af samme undersøgelse - vil dække den sande parameter med en angivet sandsynlighed, typisk 95%
Det kvantificerer den statistiske usikkerhed omkring et estimat.
Betydning og grundidé
Et konfidensinterval (ofte forkortet KI; engelsk: CI) angiver et interval af plausible værdier for en parameter baseret på data og en statistisk model. Et 95% KI betyder ikke, at der er 95% sandsynlighed for, at parameteren ligger i netop det observerede interval; det betyder, at hvis vi gentog dataindsamlingen og intervalkonstruktionen mange gange på samme måde, ville cirka 95% af de konstruerede intervaller indeholde den sande parameter.
Kerneidéen er at knytte præcision til et estimat: smalle intervaller indikerer høj præcision, brede intervaller indikerer stor usikkerhed.
Formel fortolkning
- Frekventistisk definition: Et 1−α konfidensinterval er en regel, der for enhver mulig stikprøve producerer et interval, som indeholder den sande parameter med sandsynlighed mindst 1−α, over gentagne stikprøver fra den specificerede model.
- Praktisk læsning: “95% KI: [L, U]” kommunikerer både punktestimatet og den usikkerhed, som metoden forventes at have under modellens antagelser.
- Ikke en posterior sandsynlighed: Udsagnet “parameteren ligger med 95% sandsynlighed i intervallet” er Bayesiansk; det er ikke korrekt i traditionel konfidensfortolkning.
Notation og terminologi
- Konfidensniveau/dækningsgrad: 90%, 95%, 99% er almindelige valg.
- Margin of error (fejlmargin): Halvdelen af intervalbredden i symmetriske intervaller.
- Én- vs. tosidede intervaller: Tosidet dækker på begge sider af estimatet; ensidet giver en nedre eller øvre grænse.
- Pluralis: konfidensintervaller. Udtale: [kɔnfidɛns-].
Etymologi
“Konfidensinterval” er et lån fra engelsk “confidence interval”. “Konfidens” stammer fra latin confidere (at have tillid). På dansk er “konfidensinterval” standardbetegnelsen; ældre eller alternative betegnelser som “tillidsinterval” ses sjældent.
Udregning og metoder (udvalg)
- Middelværdi (ukendt varians, normalantagelse): x̄ ± tdf, 1−α/2 · s/√n.
-
Andel (binomial):
- Wald (simpel, ofte utilstrækkelig): p̂ ± z · √(p̂(1−p̂)/n)
- Wilson-score (anbefalet ved moderate n): forbedret symmetri og dækning
- Clopper-Pearson (“exact”): konservativ, baseret på beta-fordelinger
- Forskel i middelværdier: (x̄₁−x̄₂) ± t · SE(x̄₁−x̄₂)
- Odds ratio/relativ risiko: Ofte via log-skala: log(OR) ± z · SE, derefter tilbageskalering.
- Varians/standardafvigelse (normal): χ²-baserede intervaller.
- Regressionskoefficienter: b̂ ± t · SE(b̂); for multivariat rapporteres ofte også simultane konfidensbånd.
Valg af konfidensniveau
Højere konfidensniveau giver bredere intervaller. Standardvalg afhænger af disciplin og konsekvenser ved at tage fejl.
| Konfidensniveau | Kvantiler (z≈) | Typisk brug |
|---|---|---|
| 90% | z=1,645 | Screening, udforskende analyser |
| 95% | z=1,960 | Standard i mange fagområder |
| 99% | z=2,576 | Høj sikkerhed, kritiske beslutninger |
Eksempler på brug
- Middelværdi: Et studie af systolisk blodtryk (n=100) finder x̄=128 mmHg, s=15. 95% KI = 128 ± t99,0.975·(15/√100) ≈ 128 ± 1,984·1,5 = [125,0; 131,0].
- Andel: En meningsmåling (n=500) finder p̂=0,62. 95% KI (Wald) ≈ 0,62 ± 1,96·√(0,62·0,38/500) = [0,578; 0,663]. Wilson-score giver ofte lignende men mere robuste grænser.
- Forskel i middelværdi: Lægemiddel vs. placebo: forskel=3,2 enheder, SE=1,1. 95% KI = [3,2 − 1,96·1,1; 3,2 + 1,96·1,1] = [1,0; 5,4].
- Odds ratio: OR=1,80 med 95% KI [1,20; 2,60] angiver en statistisk sikker stigning (intervallet udelukker 1).
- Regression: Hældning b̂=0,45, SE=0,10 → 95% KI [0,25; 0,65].
- Overlevelsesanalyse: Hazard ratio HR=0,72 (95% KI [0,58; 0,90]) tyder på lavere hazard i behandlingsgruppen.
- Bioækvivalens: Geometrisk middelværdi-ratio for AUC: 90% KI inden for [80%; 125%] anses ofte som ækvivalent.
- Maskinlæring/krydsvalidering: Rapportér 95% KI for præcision eller AUC via bootstrap: AUC=0,84 (95% KI [0,80; 0,88]).
Præcision, stikprøvestørrelse og fejlmargin
- Fejlmargin (E): For en andel: E ≈ z · √(p(1−p)/n). For ønsket E kan n ≈ z²·p(1−p)/E².
- Eksempel: Ønskes 95% KI med ±3 procentpoint omkring en andel nær 0,5: n ≈ 1,96²·0,25/0,03² ≈ 1067.
- For middelværdi: E ≈ z·σ/√n (σ ukendt erstattes ofte af et foreløbigt skøn).
Almindelige faldgruber og misforståelser
- Fejlagtig sandsynlighedslæsning: Et 95% KI giver ikke 95% sandsynlighed for, at netop dette interval indeholder parameteren. Det handler om metodens dækningsgrad under gentagne stikprøver.
- Konfidensinterval ≠ prædiktionsinterval: Et prædiktionsinterval dækker fremtidige observationer; det er normalt bredere.
- Overlappende KI og signifikans: To 95% KI kan godt overlappe, selv om forskellen mellem estimaterne er statistisk signifikant; omvendt gælder heller ikke simple tommelfingerregler uden forbehold.
- Modelantagelser overses: Skævheder, heteroskedasticitet eller afhængighed kan give dårlig dækning; brug robuste eller bootstrap-baserede intervaller, når relevant.
- Multipel testning: Mange intervaller på én gang kræver justering (fx Bonferroni eller simultane konfidensbånd) for at kontrollere familievis dækningsgrad.
- Rundingsfejl: Rund af med rimelig præcision; rapportér samme antal decimaler i estimat og grænser, og undgå at runde så meget, at fortolkningen ændres.
Relaterede og beslægtede begreber
- Prædiktionsinterval: Interval for en fremtidig observation, ikke for en parameter.
- Toleranceinterval: Dækker en bestemt andel af populationen med en vis sikkerhed.
- Bayesiansk troværdighedsinterval (credible interval): P(θ ∈ interval | data) = 1−α under en specificeret prior; ligner numerisk ofte KI, men har anden fortolkning.
- Bootstrap-KI: Intervaller konstrueret ved resampling (percentil, BCa m.fl.), nyttige når analytiske standardfejl er upålidelige.
- Konfidensbånd: Simultane intervaller for hele kurver (fx regressionslinjer over et x-område).
Historisk udvikling
- 1908: “Student” (William S. Gosset) introducerer t-fordelingen, der danner basis for mange intervaller for middelværdi.
- 1934: Clopper & Pearson beskriver “exact” binomiale intervaller.
- 1937: Jerzy Neyman formaliserer konfidensintervaller i den frekventistiske ramme som dækningsprocedurer.
- Senere: Udvikling af robuste og asymptotiske metoder (Wilson, Agresti-Coull, profile likelihood, bootstrap) og simultane intervaller i multipel inferens.
Praktiske rapporteringsråd
- Rapportér altid estimat med KI: “x̄ = 128 (95% KI: 125-131)”.
- Angiv metode, når det har betydning (fx “Wilson 95% KI”).
- Tilpas antal decimaler til dataskalaen; undgå overdreven præcision.
- Visualisér med fejlstænger for KI, ikke kun standardfejl, når målet er inferens.
Synonymer og beslægtede udtryk
- Synonymer (sjældne/kontekstuelle): intervalestimat; (sjældent) tillidsinterval; konfidensbånd (for kurver).
- Relaterede, men ikke synonymer: prædiktionsinterval, toleranceinterval, troværdighedsinterval (Bayesiansk), usikkerhedsinterval/dækningsinterval (metrologi).
- “Antonym” i praksis: punktestimat/punktskøn (et enkelt tal uden interval).
Ofte stillede spørgsmål
- Kan man øge konfidensniveauet uden at ændre data? Ja, men intervallet bliver bredere.
- Hvordan får man smallere intervaller? Øg stikprøvestørrelsen, reducer varians (bedre målinger/design), brug mere informativ model - eller accepter lavere konfidensniveau.
- Hvad hvis antagelser ikke holder? Overvej robuste, transformationsbaserede eller bootstrap-metoder.
Ekstra eksempler (korte)
- Forskel i andele: 8% (95% KI [3%; 13%]).
- Relativ risiko: RR=0,66 (95% KI [0,50; 0,87]).
- Standardafvigelse (normal): σ̂=12, n=40 → χ²-baseret 95% KI for σ: [9,8; 15,5].
- Medianskøn via bootstrap: median=5,2 (95% KI [4,7; 5,8]).
Anvendelsesområder
- Sundhedsvidenskab: effektmål (OR, RR, HR), gennemsnitsforskelle.
- Økonomi/samfundsvidenskab: gennemsnitlige behandlingseffekter, regressionskoefficienter.
- Ingeniørvidenskab: tolerancer, pålidelighed, fejlrater.
- Miljø/epidemiologi: koncentrationer, incidens og relative risici.
- Maskinlæring: generel præcision i metrikker under resampling.
Resumé
Konfidensintervallet er et centralt værktøj i statistisk inferens, der udtrykker usikkerhed omkring et estimat i en klar og kvantitativ form. Korrekt brug og fortolkning kræver opmærksomhed på modelantagelser, konfidensniveau, stikprøvestørrelse og den konkrete metode, der anvendes til at konstruere intervallet.
Indholdsfortegnelse
- Betydning og grundidé
- Formel fortolkning
- Notation og terminologi
- Etymologi
- Udregning og metoder (udvalg)
- Valg af konfidensniveau
- Eksempler på brug
- Præcision, stikprøvestørrelse og fejlmargin
- Almindelige faldgruber og misforståelser
- Relaterede og beslægtede begreber
- Historisk udvikling
- Praktiske rapporteringsråd
- Synonymer og beslægtede udtryk
- Ofte stillede spørgsmål
- Ekstra eksempler (korte)
- Anvendelsesområder
- Resumé