Nie masz jeszcze u Nas konta? Zarejestruj się | Zaloguj się

akceptuje  /  zamknij

Strona korzysta z plików cookies w celu realizacji usług i zgodnie z polityką plików cookies.
Możesz określić warunki przechowywania lub dostępu do plików cookies w Twojej przeglądarce.

Naukowiec.org

Nauka dla wszystkich




reklama sponsorowana

reklama sponsorowana

Reguła trzech sigm

Reguła trzech sigm jest ściśle powiązana z odchyleniem standardowym i rozkładem normalnym. Jeżeli nasza zmienna ma rozkład normalny bądź zbliżony do rozkładu normalnego to możemy wyznaczyć ile obserwacji znajduje się w pewnym zakresie mierzonym odchyleniem standardowym (od średniej). 

Bazując na wartościach rozkładu normalnego możemy powiedzieć, że około:
68,2% obserwacji znajduje się w zakresie pomiędzy +/- 1 odchylenie standardowe od średniej
95,4% obserwacji znajduje się w zakresie pomiędzy +/- 2 odchylenia standardowe od średniej
99,7% obserwacji znajduje się w zakresie pomiędzy +/- 3 odchylenia standardowe od średniej
99,994% obserwacji znajduje się w zakresie pomiędzy +/- 4 odchylenia standardowe od średniej

Dla przykładu:  Badacz zmierzył poziom inteligencji wśród 1000 uczniów szkół średnich w Polsce. W badaniach wykazał on, że średni poziom IQ wyniósł 100, a odchylenie standardowe wyniosło 15. Mógł zatem stwierdzić, że około 68% badanych uczniów ma poziom IQ w granicach 85-115 (średnia +/- 1 odchylenie standardowe = 100 +/- 15), około 95% uczniów ma poziom inteligencji w zakresie od 70 do 130, a aż 99,7% badanych uczniów ma poziom IQ pomiędzy wynikiem 55-145 (3 odchylenie standardowe od średniej). 


Masz problem z analizą statystyczna? Przejdź TU! 


I właśnie ta wartość: 3 odchyleń standardowych wiąże się z tzw. regułą trzech sigm (sigm, ponieważ symbolem odchylenia standardowego w populacji jest grecka litera sigma). Reguła ta mówi, że praktycznie wszystkie obserwacje mieszczą się w granicy 3 odchyleń standardowych od średniej, przy założeniu, że zmienna ma rozkład normalny. 

Reguła trzech sigm odnosi się przede wszystkim do praktyki. Można bowiem przyjąć, że (jeżeli zmienna ma rozkład normalny) niezmiernie rzadko w naszych obserwacjach będziemy spotykać wyniki, które będą miały aż tak bardzo odstające wyniki (in plus bądź in minus) od średniego poziomu danej cechy. Oczywiście, nie oznacza to, że pojawienie się ich nie jest możliwe, jednakże jest bardzo mało prawdopodobne, zwłaszcza gdy nie dysponujemy bardzo dużym zbiorem obserwacji. Wykorzystanie reguły trzech sigm umożliwia nam w szybki sposób odnaleźć w bazie obserwacje odstające. 

W praktyce reguła trzech sigm może być wykorzystywana jako system ostrzegania o niebezpieczeństwie / o anormalnym zachowaniu / o czymś niespotykanym. Tworząc algorytm oparty na zasadzie trzech sigm możemy skonstruować system "ostrzegania" o czymś rzadko spotykanym, np.: wyłudzenie ubezpieczenia od firmy ubezpieczeniowej.

Bardzo ważne dla wykreślanych przedziałów odsetka osób poniżej lub powyżej trzech sigm jest tutaj założenie o rozkładzie normalnym danej cechy. W przypadku, gdy zmienna nie ma rozkładu normalnego (ma inny rozkład) zakres ulega zmianie. Jeżeli nie jest w ogóle znany rozkład danej cechy to korzystając z nierówności Czebyszewa można przyjąć, że: 

75% obserwacji znajduje się pomiędzy +/- 2 odchylenia standardowe od średniej 
88,9% obserwacji znajduje się pomiędzy +/- 3 odchylenie standardowe od średniej 
93,7% obserwacji znajduje się pomiędzy +/- 4 odchylenie standardowe od średniej 

Przy czym te zakresy dotyczą sytuacji, w których nieznany jest rozkład cechy. Jeżeli wiemy, że cecha ma jakiś rozkład to do wyznaczenia tych zakresów możemy skorzystać z tablic dla danego rozkładu. 

reklama sponsorowana

x

Naukowiec.org na facebooku

Nie czekaj dłużej! Dołącz już teraz do społeczności naukowiec.org na facebooku

Trwa ładowanie wtyczki..
Zamknij