Eszkola

Korelacja statystyczna, korelacja r-Pearsona - opis

Korelacja

Korelacja oznacza związek pomiędzy zmiennymi. Analiza korelacji służy do "wychwycenia" czy zachodzi związek pomiędzy dwiema zmiennymi (właściwościami, cechami). Co oznacza związek? Choć istnieje podobieństwo (przynajmniej przez analogię) do związków interpresonalnych to jednak należy tutaj rozumieć związek jako rodzaj podobieństwa w "zachowywaniu się dwóch cech". Gdy jedna cecha, właściwość wzrasta to czy druga również wzrasta? A może maleje? A może w ogóle się nie zmienia? 

Przykład: Czy poziom kondycji fizycznej jest związana z ilością spożywanego tygodniowo alkoholu? W tym celu zapytano 100 losowo wybranych osób o średnią ilość (w litrach ;-) spożywanego alkoholu w tygodniu oraz zmierzono ich wynik w biegu na 400m. Aby stwierdzić, czy istnieje związek pomiędzy spożywanym alkoholem a kondycją fizyczną (rozumianą tutaj jako wynik w biegu na 400m) należy przeprowadzić analizę korelacji r-Pearsona pomiędzy wynikami dla tych dwóch zmiennych. 

Standardowo wynik analizy korelacji - współczynnik korelacji dostarcza nam trzech informacji: 
  1. czy wynik jest istotny statystycznie?
  2. jaka jest siła związku?
  3. jaki jest kierunek związku

Jeżeli związek jest istotny statystycznie to możemy powiedzieć, że zachodzi związek pomiędzy dwiema cechami, zmiennymi. 

Współczynnik korelacji mówi na o sile związku. Jest ona określana jako wartość w przedziałe od -1 do 1. Im współczynnik jest "dalej" od 0 (zarówno na plus jak i na minus) tym siła związku jest większa. 

Jeżeli współczynnik korelacji jest dodatni to można powiedzieć, że gdy wzrastają wartości jednej zmiennej to wzrastają wartości drugiej zmiennej (i na odwrót, maleją jednej zmiennej - maleją również drugiej). 

Przykład:
Gdyby odnotowano istotny, dodatni związek (współczynnik korelacji) pomiędzy wagą a wzrostem u ludzi to można byłoby stwierdzić, że wyższym osobom towarzyszy większa waga (wyżsi ludzie więcej ważą).

Jeżeli współczynnik korelacji jest ujemny to można powiedzieć, że gdy wzrastają wartości jednej zmiennej to maleją wartości drugiej zmiennej (i na odwrót, maleją jednej zmiennej - wzrastają w drugiej). 

Przykład:
Gdyby odnotowano istotny, ujemny związek (współczynnik korelacji) pomiędzy wagą a wzrostem u ludzi to można byłoby stwierdzić, że wyższym osobom towarzyszy mniejsza waga (wyżsi ludzie mniej ważą). Najpopularniejszą analizą korelacji jest korelacja r-Pearsona (korelacja persona).

Wzór na współczynnik korelacji r-Pearsona

Założenia korelacji r-Pearsona: 

  • zmienne mają charakter ilościowy

W przypadku, gdy zmienne mają rozkład porządkowy należy skorzystać z nieparametrycznych testów korelacyjnych, np. rho-Spearmana. Bardzo często można spotkać się z informacją, że założeniem korelacji r-Pearsona jest to, aby korelowane zmienne miały rozkłady zbliżone do rozkładu normalnego. Jest to pożądana cecha, jednakże nie jest obligatoryjna. Współczynnik r-Pearsona możemy obliczyć równiez dla zmiennych ze złamanym założeniem o rozkładzie normalnym. Należy również zwrócić uwagę na przypadki odstające, mogące zaburzać uzyskany wynik korelacji. Korelacja stanowi jedną z najbardziej popularnych miar statystycznych

  • Za pomocą korelacji określane jest podobieństwo pomiędzy parą zmiennych, co ma zastosowanie w wielu dziedzinach nauki oraz biznesu, np. czy zachodzi związek pomiędzy notowaniami ropy naftowej a akcjami PKN Orlen?
  • Stanowi podstawę zaawansowanych metod analitycznych, np: analiza czynnikowa, analiza regresji, analiza dyskryminacyjna
  • Najbardziej popularną odmianą korelacji jest korelacja liniowa. Dotyczy ona zależności liniowej (jeżeli coś rośnie to drugie też rośnie albo spada). Jednakże można obliczać również zależności kwadratowe, sześcienne itd.
  • Korelacja może dotyczyć zarówno zmiennych ilościowych (np: korelacja r-Pearsona), jak również korelacji dla zmiennych porządkowych (np: korelacja rho-Spearmana), korelacji dla zmiennych nomianalnych (np: V Cramera) 

Graficzną interpretacją współczynnika korelacji jest wykres rozrzutu. Nieparametrycznym odpowiednikiem analizy korelacji r-Pearsona jest korelacja rho-Spearmana bądź korelacja tau-b Kendalla.

Na podstawie korelacji skontruowano wiele bardziej zaawansowanych technik analitycznych, co sprawia, że jest ona jedną z najbardziej popularnych i obecnych miar statystycznych. Warto również zapoznać się z tematem korelacji cząstkowej, semicząstkowej, autokorelacji czy analizy regresji, która bazuje na mierze korelacji r-Pearsona.

Korelacja Wasze opinie

1×1 =