Eszkola

Histogram, wykres rozkładu zmiennej. - opis

Histogram


Histogram jest jednym z najbardziej popularnych wykresów statystycznych. Służy on do przedstawienia liczebności obserwacji, danych w zadanych przedziałach badanej zmiennej. Poniżej przedstawiono przykład histrogramu . Przedstawione na nim są wielkość wynagordzenia wszystkich osób w firmie X. 
 
Histogram

 

Jak można zauważyć, histogram złożony jest z prostokątnych słupków, które przedstawiają liczbność obserwacji (oś Y, pionowa) w danym przedziale (oś X, pozioma). W naszym przykładzie zmienną jest poziom dochodów, zarobków w firmie X. Wielkość przedziałów jest równa. To znaczy, pierwszy słupek opisuje liczebność osób zarabiających od 0 do 666 zł, drugi od 667 zł do 1333zł, itd.. Rozpiętość przedziałów jest taka sama w histogramie. Różnica polega na wysokości słupków (liczebności obserwacji). W naszym przykładzie możemy zauważyć, że najwięcej w firmie jest osób zarabiających od 1333 do 2000zł oraz od 2000zł do 2666zł.

 

 

Histogram służy do przedstawienia rozkładów empirycznych cech, co oznacza, że za jego pomocą, przedstawiamy jakie uzyskaliśmy wyniki dla pewnych zmiennych ilościowych. Odpowiada na pytania (w sposób graficzny) przy jakich wartościach zlokalizowane jest większość naszych wyników. Czy jakaś wartość (przedział wokół niej) jest najbardziej reprezentowany w naszym zbiorze danych? Czy występuje asymetria wyników? W naszym przykładowym histogramie możemy zauważyć, że najwięcej osób zarabia około 1800zł, a nieliczne osoby zarabiają ponad 6000zł. Histogramy często używane przy dużych liczebnościach, gdzie analiza samych licz (w tablekach) może być uciążliwa z powodu ilości danych. Histogramy pozwlają badaczowi "szybko" przeanalizować strukturę analizowanych zmiennych. 
 

 

Po względem technicznym zaleca sie, aby histogramy miały 15 przedziałów, jednakże ma to sens, w przypadku większej ilości obserwacji. Najmniejszą liczbą przedziałów jest 5, poniżej tej wartości, nie ma sensu robić histogramu. Należy znowu podreślić - histrogram służy najcześciej badaczowi do określenia "natury, charakteru rozkładu zmiennej". Badacze bardzo często wykorzystują histogramy w oszacowaniu podobieństwa rozkładu zmiennej do rozkładu normalnego.

Histogram Wasze opinie

9-4 =