Reguła trzech sigm jest ściśle powiązana z odchyleniem standardowym i rozkładem normalnym. Jeżeli nasza zmienna ma rozkład normalny bądź zbliżony do rozkładu normalnego to możemy wyznaczyć, ile obserwacji znajduje się w pewnym zakresie mierzonym odchyleniem standardowym (od średniej).
Rozkład normalny
Bazując na wartościach rozkładu normalnego, możemy powiedzieć, że około:
68,2% obserwacji znajduje się w zakresie pomiędzy +/- 1 odchylenie standardowe od średniej
95,4% obserwacji znajduje się w zakresie pomiędzy +/- 2 odchylenia standardowe od średniej
99,7% obserwacji znajduje się w zakresie pomiędzy +/- 3 odchylenia standardowe od średniej
99,994% obserwacji znajduje się w zakresie pomiędzy +/- 4 odchylenia standardowe od średniej
Dla przykładu: Badacz zmierzył poziom inteligencji wśród 1000 uczniów szkół średnich w Polsce. W badaniach wykazał on, że średni poziom IQ wyniósł 100, a odchylenie standardowe wyniosło 15. Mógł zatem stwierdzić, że około 68% badanych uczniów ma poziom IQ w granicach 85-115 (średnia +/- 1 odchylenie standardowe = 100 +/- 15), około 95% uczniów ma poziom inteligencji w zakresie od 70 do 130, a aż 99,7% badanych uczniów ma poziom IQ pomiędzy wynikiem 55-145 (3 odchylenia standardowe od średniej).
I właśnie ta wartość: 3 odchylenia standardowe wiąże się z tzw. regułą trzech sigm (sigm, ponieważ symbolem odchylenia standardowego w populacji jest grecka litera sigma). Reguła ta mówi, że praktycznie wszystkie obserwacje mieszczą się w granicy 3 odchyleń standardowych od średniej, przy założeniu, że zmienna ma rozkład normalny.
Reguła trzech sigm
Reguła trzech sigm odnosi się przede wszystkim do praktyki. Można bowiem przyjąć, że (jeżeli zmienna ma rozkład normalny) niezmiernie rzadko w naszych obserwacjach będziemy spotykać wyniki, które będą miały aż tak bardzo odstające wyniki (in plus bądź in minus) od średniego poziomu danej cechy. Oczywiście, nie oznacza to, że pojawienie się ich nie jest możliwe, jednakże jest bardzo mało prawdopodobne, zwłaszcza gdy nie dysponujemy bardzo dużym zbiorem obserwacji. Wykorzystanie reguły trzech sigm umożliwia nam w szybki sposób odnaleźć w bazie obserwacje odstające.
W praktyce reguła trzech sigm może być wykorzystywana jako system ostrzegania o niebezpieczeństwie / o anormalnym zachowaniu / o czymś niespotykanym. Tworząc algorytm oparty na zasadzie trzech sigm, możemy skonstruować system "ostrzegania" o czymś rzadko spotykanym, np.: wyłudzenie ubezpieczenia od firmy ubezpieczeniowej.
Bardzo ważne dla wykreślanych przedziałów odsetka osób poniżej lub powyżej trzech sigm jest tutaj założenie o rozkładzie normalnym danej cechy. W przypadku, gdy zmienna nie ma rozkładu normalnego (ma inny rozkład) zakres ulega zmianie. Jeżeli nie jest w ogóle znany rozkład danej cechy, to korzystając z nierówności Czebyszewa można przyjąć, że:
75% obserwacji znajduje się pomiędzy +/- 2 odchylenia standardowe od średniej
88,9% obserwacji znajduje się pomiędzy +/- 3 odchylenie standardowe od średniej
93,7% obserwacji znajduje się pomiędzy +/- 4 odchylenie standardowe od średniej
Przy czym te zakresy dotyczą sytuacji, w których nieznany jest rozkład cechy. Jeżeli wiemy, że cecha ma jakiś rozkład, to do wyznaczenia tych zakresów możemy skorzystać z tablic dla danego rozkładu.
Reguła trzech sigm Wasze opinie
moja opinia nie odstaje od poprzednich także jest pozytywna pozdrawiam
Moja też pozytywna pozdrawiam
moja opinia również jak najbardziej pozytywna pozdrawiam
moja opinia jest pozytywna ruwniesz pozdrawiam
moja opinia rowniez pozytywna pozdrawiam
moja opinia jest pozytywna pozdrawiam