Wzór na korelację rho-Spearmana wykorzystujący różnicę rang
Aby obliczyć współczynnik korelacji rho-Spearmana należy na wstępie porangować obserwacje dla jednej i drugiej zmiennej. Wzór na korelację rho-Spearmana wykorzystujący różnicę rang ma postać:
\(rho(x,y) = 1 - \dfrac{6\sum\limits_{i=1}^{n}d_i^2 + T_x +T_y}{n(n^2 - 1)}\)
gdzie:
\(rho\) - korelacja rho-Spearmana pomiędzy zmienną X i Y
\(d_i\) - różnica rang pomiędzy tymi samymi obserwacjami dla dwóch zmiennych
\(n\) - liczba obserwacji
\(T_x = \dfrac{1}{12}\sum\limits_i(t_i^3 - t_i)\)
\(T_y = \dfrac{1}{12}\sum\limits_i(u_i^3 - u_i)\)
\(t\) - liczba obserwacji posiadających tę samą rangę dla zmiennej X
\(u\) - liczba obserwacji posiadających tę samą rangę dla zmiennej Y
Gdy nie ma rang wiązanych ze wzoru eliminujemy \(T_x\) i \(T_y\), z racji, że przyjmują one wartość 0.
Programy statystyczne najczęściej jednak wykorzystują klasyczną postać korelacji rho-Spearmana, orginalnie zaproponowaną przez Spearmana.
Wzór na korelację rho-Spearmana - klasyczna postać
Wzór na korelację rho-Spearmana wykorzystujący różnicę rang - jak stosować w praktyce?