Wzór na test niezależności chi-kwadrat ma postać:
\(\chi^2 = \sum\limits_{j=1}^{k}\dfrac{(O_j - E_j)^2}{E_j}\)
gdzie:
\(\chi^2\) - test chi-kwadrat
\(O_j\) - liczebność obserwowana dla danej grupy
\(E_j\) - liczebność oczekiwana dla danej grupy
Wzór na test zgodności chi-kwadrat
Przykład obliczenia wzoru:
W badaniu otrzymaliśmy następujące wyniki:
Tabela - Wartości obserwowane \(O_j\)
Wiek/płeć | Kobiety | Mężczyźni | Ogółem |
do 30 lat | 12 | 12 | 24 |
30-50 lat | 22 | 15 | 37 |
powyżej 50 lat | 16 | 23 | 39 |
Ogółem | 50 | 50 | 100 |
Na podstawie wyników obserwowanych musimy wyliczyć wartości oczekiwane dla wyników, czyli wartości, które oczekiwalibyśmy, gdyby nie było żadnych różnic. Proporcja dla jednej zmiennej, np 50% kobiet i 50% mężczyzn powinna być zachowana dla każdego poziomu drugiej zmiennej. W naszym przykładzie proporcja wynosi właśnie 50%-50% czyli wartości oczekiwane będą miały następującą postać:
Tabela - Wartości oczekiwane \(E_j\)
Wiek/płeć | Kobiety | Mężczyźni |
do 30 lat | 12 | 12 |
30-50 lat | 18,5 | 18,5 |
powyżej 50 lat | 19,5 | 19,5 |
Należy zauważyć, że 24 * 50% = 12; 37 * 50% = 18,5; 39 * 50% = 19,5
Następnie musimy dokonać odpowiednich obliczeń
Tabela. Obliczenia dla testu chi-kwadrat niezależności \(\chi^2\)
Płeć | Wiek | Wartość obserwowana \(O_j\) | Wartość oczekiwana \(E_j\) | Różnica | Kwadrat różnicy | Iloraz kwadratu różnicy i wartości oczekiwanej |
kobiety | do 30 lat | 12 | 12 | 0 | 0 | 0 |
30 - 50 lat | 22 | 18,5 | 3,5 | 12,5 | 0,662 | |
powyżej 50 lat | 16 | 19,5 | -3,5 | 12,5 | 0,628 | |
mężczyźni | do 30 lat | 12 | 12 | 0 | 0 | 0 |
30 - 50 lat | 15 | 18,5 | -3,5 | 12,5 | 0,662 | |
powyżej 50 lat | 23 | 19,5 | 3,5 | 12,5 | 0,628 | |
Wynik testu chi-kwadrat \(\chi^2\) | \(\sum\) = 2,581 |
Następnie uzyskany wynik możemy odnieść do tablic rozkładu chi-kwadrat. W tym przypadku liczba stopni swobody wynosi 1, ponieważ:
liczba kategorii płci = 2
liczba kategorii wieku = 3
(2 - 1) * (3 - 1) = 2 - liczba stopni swobody
Tablice rozkładu chi-kwadrat
Można również skorzystać z naszego kalkulatora prawdopodobieństwa chi-kwadrat - aby wyliczyć dokładny poziom prawdopodobieństwa dla danego wyniku testu i liczby stopni swobody.
Wzór na test niezależności chi-kwadrat - jak stosować w praktyce?