Sposób obliczania wartości oczekiwanej w teście niezależności chi-kwadrat w tabelach krzyżowych
Wartość oczekiwana - idea
Należy jednak zauważyć, że sam rozkład wyników dla poszczególnej zmiennej jest najczęściej nierównomierny, dlatego też wyliczenia samej wartości oczekiwanej (niezbędnej do liczenia ze wzoru wyniku testu niezależności chi-kwadrat stanowi często problem. Wartość oczekiwana bierze pod uwagę "dysproporcje" pomiędzy osobami w każdej z analizowanych grup i zmiennych.
Poziom wykształcenia | Płeć | |||||
Kobiety | Mężczyźni | Ogółem | ||||
Liczebność | % z płci | Liczebność | % z płci | Liczebność | % z płci | |
Zawodowe | 5 | 5,3% | 32 | 34,4% | 37 | 19,7% |
Średnie | 62 | 65,3% | 37 | 39,8% | 99 | 52,7% |
Wyższe | 28 | 29,5% | 24 | 25,8% | 52 | 27,7% |
Ogółem | 95 | 93 | 188 | |||
% z wykształcenia | 50,5% | 49,5% | 100,0% |
Obliczanie wartości oczekiwanej
Aby obliczyć wartość oczekiwaną (będzie ona różna w każdej z celek) musimy wziąć pod uwagę zarówno dysproporcję pomiędzy płciami (50,5% oraz 49,5%) jak i dysproporcję pomiędzy poziomem wykształcenia (19,7%, 52,7% i 27,7%). Możemy zastosować tutaj dwa sposoby obliczenia: liczbę kobiet i mężczyzn dzielić proporcją dla poziomu wykształcenia lub liczbę osób o różnym wykształceniu dzielić proporcją dla płci. Oba rozwiązania dają ten sam wynik! Zatem obojętne jest to, z którego skorzystamy.
Zatem wartości oczekiwane obliczamy następująco:
19,7% z 95 kobiet = 18,70
52,7% z 95 kobiet = 50,03
27,7% z 95 kobiet = 26,28
19,7% z 93 mężczyzn = 18,30
52,7% z 93 mężczyzn = 48,97
27,7% z 93 mężczyzn = 25,72
Albo
50,5% z 37 osób z wykształceniem zawodowym = 18,70
50,5% z 99 osób z wykształceniem średnim = 50,03
50,5% z 52 osób z wykształceniem wyższym = 26,28
49,5% z 37 osób z wykształceniem zawodowym = 18,30
49,5% z 99 osób z wykształceniem średnim = 48,97
49,5% z 52 osób z wykształceniem wyższym = 25,72
Należy zatem pamiętać, że wartość oczekiwania w teście niezależności chi-kwadrat (zazwyczaj) nie odzwierciedla równego podziału pod względem liczby badanych "celek" a bierze pod uwagę różnice występujące w liczbie przebadanych osób dla danej zmiennej bez uwzględniania w niej drugiej zmiennej.
Wartość oczekiwana w teście niezależności chi-kwadrat Wasze opinie