Home

Konfidensintervaller

Konfidensintervall er et intervall som brukes som estimat av en ukjent parameter i en populasjon, basert på data fra et utvalg. Intervallets konfidensnivå, ofte 95 %, uttrykker hvor ofte slike intervaller vil dekke den sanne parameteren hvis man gjentar studien mange ganger under tilsvarende forhold. Intervallene avhenger av estimatet, utvalgets størrelse og variasjon i dataene, og de bygger på en modell for fordeling og usikkerhet.

For et enkelt gjennomsnitt kan konfidensintervallet beregnes på ulike måter. Når man kjenner populasjonsstandardavviket σ, brukes x̄

Tolkningen av et konfidensintervall er at den lange rekke av intervaller konstruert ved samme metode vil inneholde

±
z_(1-α/2)
·
σ/√n.
Når
σ
ikke
er
kjent,
brukes
estimatet
s
og
t-fordelingen:
x̄
±
t_(n-1,1-α/2)
·
s/√n.
For
forhold
kan
man
bruke
p̂
±
z_(1-α/2)
·
sqrt[p̂(1−p̂)/n]
under
tilfredsstillende
n,
ofte
større
enn
30.
Mindre
utvalg
krever
ofte
bruk
av
t-
eller
andre
kontrollert
metoder.
den
sanne
parameteren
i
en
andel
tilsvarende
konfidensnivået.
Det
betyr
ikke
at
en
bestemt
intervall
har
95
%
sannsynlighet
for
å
inneholde
parameteren;
parameteren
er
fast,
og
metoden
har
oppgitt
dekning
over
gjentatte
studier.
Konfidensintervaller
er
underlagt
forutsetninger
som
randomisering,
uavhengighet
og
riktig
modellvalg;
misforståelser
oppstår
ofte
ved
å
tolke
intervallet
som
et
sannsynlighetsutspill
for
parameteren.
Bootstrap
og
andre
resampling-teknikker
gir
alternative
måter
å
få
intervaller
uten
sterke
parametiske
antakelser.