Home

prosentilene

Prosentilene er verdier i et datasett som deler de sorterte observasjonene i hundre like store grupper. For et gitt prosenttall p (0 < p < 100) representerer prosentilen den verdien som minst p prosent av observasjonene er mindre enn eller lik. Prosentilene er en form for kvantiler og brukes til å beskrive fordelingens plassering og variasjon.

I praksis sorteres dataene slik at x1 ≤ x2 ≤ ... ≤ xn. En vanlig definisjon er at p-prosentilen er

Vanlige prosentiler inkluderer P25, P50 (median) og P75. P25 er verdien hvor 25 prosent av dataene ligger

Bruksområder inkluderer oppsummering av fordelingsegenskaper, sammenligning av grupper og identifikasjon av uteliggere. Prosentilene er uavhengige av

Praktiske hensyn inkluderer forskjellen mellom populasjonsprosentiler og utvalgsprosentiler, som kan være betydelige i små datasett. Konfidensintervaller

verdien
ved
posisjon
k
=
p/100
·
(n+1).
Når
k
ikke
er
et
helt
tall,
estimeres
den
ved
lineær
interpolasjon
mellom
naboene.
Det
finnes
andre
definisjoner
i
statistikk;
valget
påvirker
resultatene
spesielt
i
små
utvalg.
under,
P50
deler
fordelingen
i
to
like
deler,
og
P75
er
verdien
under
hvilken
75
prosent
av
observasjonene
ligger.
Prosentilene
brukes
også
som
deciler
og
generelt
som
kvantiler
for
å
beskrive
fordelingens
form
og
spredning.
skalaen
og
brukes
sammen
med
andre
statistiske
mål
som
gjennomsnitt,
spredning
og
kvartiler.
I
praksis
beregnes
de
i
statistikkprogramvare
eller
regneark
og
rapporteres
ofte
med
antall
observasjoner
samt
valg
av
interpolasjonsmetode.
kan
vurderes
via
bootstrap
eller
andre
inferensmetoder.
Prosentilene
gir
en
robust
måte
å
beskrive
data
på,
spesielt
for
skjev
fordeling
der
gjennomsnittet
ikke
gir
et
fullstendig
bilde.