Home

histogramy

Histogramy to graficzna reprezentacja rozkładu zmiennej numerycznej. Na osi poziomej umieszczamy wartości zmiennej podzielone na przedziały, zwane binami, a na osi pionowej – liczbę obserwacji znajdujących się w każdym przedziale lub ich gęstość (dla histogramu znormalizowanego). Przedziały powinny pokryć zakres danych i mieć stałą szerokość, choć w praktyce stosuje się także różne szerokości. Ogólna liczba binów i ich granice wpływają na wygląd i odczyt rozkładu.

Jak je tworzyć: z danych numerycznych wybieramy zakres, ustawiamy liczbę binów (lub szerokość przedziału), zliczamy obserwacje

Zastosowania i ograniczenia: Histogramy umożliwiają szybkie rozpoznanie cech rozkładu: symetrii, skosu, modalności, rozpiętości i obecności odstających.

w
każdym
binie
i
rysujemy
słupki
o
wysokości
odpowiadającej
liczbie
(lub
gęstości).
Histogram
z
gęstością
prezentuje
częstotliwość
w
sposób
znormalizowany
tak,
że
pole
pod
wykresem
równa
się
1.
W
praktyce
używa
się
różnych
reguł
do
wyboru
liczby
binów,
na
przykład
reguła
Sturgesa,
reguła
Scotta,
reguła
Freedmana–Diaconisa;
w
zależności
od
danych
mogą
prowadzić
do
różnych
wniosków.
Mogą
być
również
wykorzystywane
w
przetwarzaniu
obrazów
(wyrównywanie
histogramu,
poprawa
kontrastu)
oraz
w
eksploracyjnej
analizie
danych.
Wadami
są
zależność
wyników
od
sposobu
podziału
oraz
brak
informacji
o
zależnościach
między
zmiennymi;
w
praktyce
często
uzupełnia
się
je
wykresami
skumulowanymi
lub
pudełkowymi.