Eszkola

Reguła trzech sigm

Przydatne kalkulatory i narzędzia

Reguła trzech sigm jest ściśle powiązana z odchyleniem standardowym i rozkładem normalnym. Jeżeli nasza zmienna ma rozkład normalny bądź zbliżony do rozkładu normalnego to możemy wyznaczyć, ile obserwacji znajduje się w pewnym zakresie mierzonym odchyleniem standardowym (od średniej). 

Rozkład normalny

Bazując na wartościach rozkładu normalnego, możemy powiedzieć, że około:
68,2% obserwacji znajduje się w zakresie pomiędzy +/- 1 odchylenie standardowe od średniej
95,4% obserwacji znajduje się w zakresie pomiędzy +/- 2 odchylenia standardowe od średniej
99,7% obserwacji znajduje się w zakresie pomiędzy +/- 3 odchylenia standardowe od średniej
99,994% obserwacji znajduje się w zakresie pomiędzy +/- 4 odchylenia standardowe od średniej

Dla przykładu:  Badacz zmierzył poziom inteligencji wśród 1000 uczniów szkół średnich w Polsce. W badaniach wykazał on, że średni poziom IQ wyniósł 100, a odchylenie standardowe wyniosło 15. Mógł zatem stwierdzić, że około 68% badanych uczniów ma poziom IQ w granicach 85-115 (średnia +/- 1 odchylenie standardowe = 100 +/- 15), około 95% uczniów ma poziom inteligencji w zakresie od 70 do 130, a aż 99,7% badanych uczniów ma poziom IQ pomiędzy wynikiem 55-145 (3 odchylenia standardowe od średniej). 

I właśnie ta wartość: 3 odchylenia standardowe wiąże się z tzw. regułą trzech sigm (sigm, ponieważ symbolem odchylenia standardowego w populacji jest grecka litera sigma). Reguła ta mówi, że praktycznie wszystkie obserwacje mieszczą się w granicy 3 odchyleń standardowych od średniej, przy założeniu, że zmienna ma rozkład normalny. 

Reguła trzech sigm

Reguła trzech sigm odnosi się przede wszystkim do praktyki. Można bowiem przyjąć, że (jeżeli zmienna ma rozkład normalny) niezmiernie rzadko w naszych obserwacjach będziemy spotykać wyniki, które będą miały aż tak bardzo odstające wyniki (in plus bądź in minus) od średniego poziomu danej cechy. Oczywiście, nie oznacza to, że pojawienie się ich nie jest możliwe, jednakże jest bardzo mało prawdopodobne, zwłaszcza gdy nie dysponujemy bardzo dużym zbiorem obserwacji. Wykorzystanie reguły trzech sigm umożliwia nam w szybki sposób odnaleźć w bazie obserwacje odstające. 

W praktyce reguła trzech sigm może być wykorzystywana jako system ostrzegania o niebezpieczeństwie / o anormalnym zachowaniu / o czymś niespotykanym. Tworząc algorytm oparty na zasadzie trzech sigm, możemy skonstruować system "ostrzegania" o czymś rzadko spotykanym, np.: wyłudzenie ubezpieczenia od firmy ubezpieczeniowej.

Bardzo ważne dla wykreślanych przedziałów odsetka osób poniżej lub powyżej trzech sigm jest tutaj założenie o rozkładzie normalnym danej cechy. W przypadku, gdy zmienna nie ma rozkładu normalnego (ma inny rozkład) zakres ulega zmianie. Jeżeli nie jest w ogóle znany rozkład danej cechy, to korzystając z nierówności Czebyszewa można przyjąć, że: 

75% obserwacji znajduje się pomiędzy +/- 2 odchylenia standardowe od średniej 
88,9% obserwacji znajduje się pomiędzy +/- 3 odchylenie standardowe od średniej 
93,7% obserwacji znajduje się pomiędzy +/- 4 odchylenie standardowe od średniej 

Przy czym te zakresy dotyczą sytuacji, w których nieznany jest rozkład cechy. Jeżeli wiemy, że cecha ma jakiś rozkład, to do wyznaczenia tych zakresów możemy skorzystać z tablic dla danego rozkładu. 

Reguła trzech sigm Wasze opinie

6×6 =
  • M Martyna 13.06.2024

    moja opinia nie odstaje od poprzednich także jest pozytywna pozdrawiam

  • M Michał 30.01.2024

    Moja też pozytywna pozdrawiam

  • łukasz 12.01.2024

    moja opinia również jak najbardziej pozytywna pozdrawiam

  • W wojcieh 01.02.2023

    moja opinia jest pozytywna ruwniesz pozdrawiam

  • K kszysztof 08.01.2023

    moja opinia rowniez pozytywna pozdrawiam

  • A andrzej 17.11.2022

    moja opinia jest pozytywna pozdrawiam