W tym artykule zaprezentowany zostanie sposób obliczania wartości oczekiwanej w teście niezależności chi-kwadrat, w tabelach krzyżowych.
Wartość oczekiwana - idea
Wartość oczekiwana w teście niezależności chi-kwadrat oznacza ile osób powinno być w danym warunku badawczym, w danej celce, gdyby badania badane grupy w ogóle nie różniły się między sobą. Jeżeli chcemy sprawdzić, czy występują istotne statystycznie różnice pomiędzy grupami dla wyników obserwowanych, musimy je odnieść do wyników oczekiwanych, czyli takich, gdyby zmienne nie różniły się między sobą.
Należy jednak zauważyć, że sam rozkład wyników dla poszczególnej zmiennej jest najczęściej nierównomierny, dlatego też wyliczenia samej wartości oczekiwanej (niezbędnej do liczenia ze wzoru wyniku testu niezależności chi-kwadrat stanowi często problem. Wartość oczekiwana bierze pod uwagę "dysproporcje" pomiędzy osobami w każdej z analizowanych grup i zmiennych.
Wartość oczekiwana - idea
Wartość oczekiwana w teście niezależności chi-kwadrat oznacza ile osób powinno być w danym warunku badawczym, w danej celce, gdyby badania badane grupy w ogóle nie różniły się między sobą. Jeżeli chcemy sprawdzić, czy występują istotne statystycznie różnice pomiędzy grupami dla wyników obserwowanych, musimy je odnieść do wyników oczekiwanych, czyli takich, gdyby zmienne nie różniły się między sobą.
Należy jednak zauważyć, że sam rozkład wyników dla poszczególnej zmiennej jest najczęściej nierównomierny, dlatego też wyliczenia samej wartości oczekiwanej (niezbędnej do liczenia ze wzoru wyniku testu niezależności chi-kwadrat stanowi często problem. Wartość oczekiwana bierze pod uwagę "dysproporcje" pomiędzy osobami w każdej z analizowanych grup i zmiennych.
Nie można po prostu przyjąć, że skoro przebadaliśmy 100 osób i badamy zależność pomiędzy np: płcią (2 poziomy) i poziomem wykształcenia (3 poziomy) to mając 6 różnych grup (2x3) wartość oczekiwana powinna wynieść 16,6 osoby w każdej z grup. Takie rozwiązanie miałoby miejsce, gdybyśmy przebadali równą liczbę kobiet i mężczyzn i równą liczbę osób z poszczególnym poziomem wykształcenia. Jednakże takie wyniki rzadko występują. Poniżej przedstawiony zostanie sposób obliczenia wartości oczekiwanej w tabeli krzyżowej.
Przykład: Badacz chciał sprawdzić, czy kobiety różniły się od mężczyzn pod względem poziomu posiadanego wykształcenia. Uzyskał w badaniu następujące wyniki.
Aby obliczyć wartość oczekiwaną (będzie ona różna w każdej z celek) musimy wziąć pod uwagę zarówno dysproporcję pomiędzy płciami (50,5% oraz 49,5%) jak i dysproporcję pomiędzy poziomem wykształcenia (19,7%, 52,7% i 27,7%). Możemy zastosować tutaj dwa sposoby obliczenia: liczbę kobiet i mężczyzn dzielić proporcją dla poziomu wykształcenia lub liczbę osób o różnym wykształceniu dzielić proporcją dla płci. Oba rozwiązania dają ten sam wynik! Zatem obojętne jest to, z którego skorzystamy.
Zatem wartości oczekiwane obliczamy następująco:
19,7% z 95 kobiet = 18,70
52,7% z 95 kobiet = 50,03
27,7% z 95 kobiet = 26,28
19,7% z 93 mężczyzn = 18,30
52,7% z 93 mężczyzn = 48,97
27,7% z 93 mężczyzn = 25,72
Albo
50,5% z 37 osób z wykształceniem zawodowym = 18,70
50,5% z 99 osób z wykształceniem średnim = 50,03
50,5% z 52 osób z wykształceniem wyższym = 26,28
49,5% z 37 osób z wykształceniem zawodowym = 18,30
49,5% z 99 osób z wykształceniem średnim = 48,97
49,5% z 52 osób z wykształceniem wyższym = 25,72
Należy zatem pamiętać, że wartość oczekiwania w teście niezależności chi-kwadrat (zazwyczaj) nie odzwierciedla równego podziału pod względem liczby badanych "celek" a bierze pod uwagę różnice występujące w liczbie przebadanych osób dla danej zmiennej bez uwzględniania w niej drugiej zmiennej.
Poziom wykształcenia | Płeć | |||||
Kobiety | Mężczyźni | Ogółem | ||||
Liczebność | % z płci | Liczebność | % z płci | Liczebność | % z płci | |
Zawodowe | 5 | 5,3% | 32 | 34,4% | 37 | 19,7% |
Średnie | 62 | 65,3% | 37 | 39,8% | 99 | 52,7% |
Wyższe | 28 | 29,5% | 24 | 25,8% | 52 | 27,7% |
Ogółem | 95 | 93 | 188 | |||
% z wykształcenia | 50,5% | 49,5% | 100,0% |
Aby obliczyć wartość oczekiwaną (będzie ona różna w każdej z celek) musimy wziąć pod uwagę zarówno dysproporcję pomiędzy płciami (50,5% oraz 49,5%) jak i dysproporcję pomiędzy poziomem wykształcenia (19,7%, 52,7% i 27,7%). Możemy zastosować tutaj dwa sposoby obliczenia: liczbę kobiet i mężczyzn dzielić proporcją dla poziomu wykształcenia lub liczbę osób o różnym wykształceniu dzielić proporcją dla płci. Oba rozwiązania dają ten sam wynik! Zatem obojętne jest to, z którego skorzystamy.
Zatem wartości oczekiwane obliczamy następująco:
19,7% z 95 kobiet = 18,70
52,7% z 95 kobiet = 50,03
27,7% z 95 kobiet = 26,28
19,7% z 93 mężczyzn = 18,30
52,7% z 93 mężczyzn = 48,97
27,7% z 93 mężczyzn = 25,72
Albo
50,5% z 37 osób z wykształceniem zawodowym = 18,70
50,5% z 99 osób z wykształceniem średnim = 50,03
50,5% z 52 osób z wykształceniem wyższym = 26,28
49,5% z 37 osób z wykształceniem zawodowym = 18,30
49,5% z 99 osób z wykształceniem średnim = 48,97
49,5% z 52 osób z wykształceniem wyższym = 25,72
Należy zatem pamiętać, że wartość oczekiwania w teście niezależności chi-kwadrat (zazwyczaj) nie odzwierciedla równego podziału pod względem liczby badanych "celek" a bierze pod uwagę różnice występujące w liczbie przebadanych osób dla danej zmiennej bez uwzględniania w niej drugiej zmiennej.
Wartość oczekiwana w teście niezależności chi-kwadrat Wasze opinie