Czym jest estymator?
Estymatorem nazywamy parametr obliczony dla próby badawczej, na podstawie którego szacujemy prawdziwą wartość parametru w populacji. Chcąc dowiedzieć się czegoś o badanej populacji, przeprowadzamy badania na próbie wylosowanej z tej populacji. Estymator zatem oznacza szacowany parametr w populacji na podstawie próby, np.: średnia arytmetyczna jest estymatorem wartości oczekiwanej. Wyliczając średnią arytmetyczną w naszym badaniu, szacujemy, estymujemy wartość oczekiwaną (wartość średnią) w populacji. Tak samo dla wariancji, obliczamy wariancję z próby w celu oszacowania wariancji z populacji. Należy zaznaczyć, że wzory na wariancję w populacji i wariancję w próbie różnią się od siebie.
Cechy estymatorów
W praktyce dla estymacji, oszacowania poszukiwanego parametru możemy zastosować bardzo wiele różnych estymatorów. Jednakże różnią się one swoją użytecznością w oszacowaniu danego parametru dla danego rozkładu i charakteru zmiennej. Możemy wyróżnić cztery główne właściwości / cechy estymatorów:
1. Nieobciążoność estymatora
2. Efektywność estymatora
3. Zgodność estymatora
4. Dostateczność estymatora
W dalszej części wyjaśnimy prostym językiem czym są owe właściwości / cechy estymatorów
Nieobciążoność estymatora
możemy określić jako niewystępowanie błędu systematycznego w ocenie parametru (np.: wariancji) na podstawie estymatora. Jeżeli przeprowadzilibyśmy dane badania (szacunki na podstawie prób, kolejnych badań), wielokrotnie to wraz ze wzrostem liczby prób (badań) estymator nieobciążony będzie zbliżał się do prawdziwej informacji / wartości poszukiwanego parametru. Wraz ze wzrostem liczby prób będzie malał błąd szacunku parametru na podstawie estymatora. W przypadku estymatora obciążonego oszacowana wartość będzie obciążona błędem systematycznym. Przykład: Średnia arytmetyczna jest nieobciążonym estymatorem wartości oczekiwanej w populacji. W przypadku wariancji, gdybyśmy zastosowali wzór na wariancję w populacji, to estymator ten byłby parametrem obciążonym. Wykazano, że oszacowanie wariancji na podstawie takiego wzoru nie przybliża estymatora do poszukiwanego parametru. Dopiero przyjęcie wzoru na wariancję w próbie (dzieląc nie przez N, tylko przez N - 1) eliminuje obciążoność estymatora.
Efektywność estymatora
to innymi słowy wielkość wariancji estymatora. Im efektywniejszy jest estymator, tym ma mniejszą wariancję w kolejnych pomiarach. Innymi słowy, "narzędzie" (estymator) do estymacji parametru tym jest lepsze, im dostarcza mniej zmiennych wyników. Załóżmy, że lekarz bada temperaturę ciała u człowieka trzema termometrami, jeden dał wyniki: 36,6; 36,7 i 36,6; drugi termometr: 36,3; 36,6; 36,8 a trzeci termometr: 36,2; 37,2 i 36,6... który zatem jest najefektywniejszy? Ten pierwszy, bo ma najmniejszą zmienność w dokonywanych pomiarach. Tak samo jest przy estymatorach, ten jest najefektywniejszy, który ma najmniejszą wariancję. Przykład: Najefektywniejszym estymatorem wartości oczekiwanej w rozkładzie normalnym jest średnia arytmetyczna.
Zgodność estymatora
oznacza, że wraz ze wzrostem liczby prób coraz bardziej zbliżamy się do prawdziwej szacowanej wartości. Jeżeli nasz estymator jest zbieżny, to oznacza, że im więcej prób pomiaru danej wartości przeprowadzimy to estymator będzie zbliżał się do rzeczywistej wartości a tym samym będzie malał błąd oceny parametru przez estymator. Im coś dłużej obserwujemy, tym więcej o tym powinniśmy wiedzieć. Zatem intuicyjnie wiemy, że dobry estymator powinien zbyć zbieżny do szacowanego parametru. Przykład: Zbieżnym estymatorem wartości oczekiwanej jest średnia arytmetyczna.
Dostateczność estymatora
nazywamy liczbę informacji, jaką zawiera dany estymator w szacowaniu parametru. Jeżeli mamy 10 wyników to do oszacowania prawdziwego parametru powinniśmy uwzględnić wszystkie dostępne informacje, jakie mamy, aby estymator uznać za dostateczny. Jeżeli dany estymator pomija pewną część dostępnych informacji, np.: korzysta jedynie z 2 z 10 dostępnych wyników, to nie jest on dostateczny. Przykład: średnia arytmetyczna jest dostatecznym estymatorem wartości oczekiwanej, ponieważ wyliczając ją, bierzemy informację, ze wszystkich naszych obserwacji. Natomiast połowa rozstępu (max - min) będzie korzystała jedynie z dwóch informacji, wartości minimalnej i maksymalnej, dlatego też nie będzie ona dostatecznym estymatorem wartości oczekiwanej.
Zatem najlepszymi estymatorami poszukiwanych parametrów są estymatory nieobciążone, najefektywniejsze, zgodne i dostateczne.
Estymatory Wasze opinie