Eszkola

Analiza regresji - opis

Przydatne kalkulatory i narzędzia

Regresja, model regresyjny jest jedną z najbardziej popularnych metod analizy danych statystycznych. Główną ideą regresji jest przewidywanie, prognozowanie danych dla pewnej zmiennej na podstawie innych zmiennych. Innymi słowy, jaką wartość przyjmie dana zmienna gdy będziemy znali wartość innej zmiennej. Oczywiście, aby móc "poszukiwać" wartości jednej zmiennej na podstawie innej zmiennej musimy za pomocą analizy regresji skonstruować model regresyjny, model, który będzie z założonym błędem statystycznym przewidywał wartość, poziom danej cechy. 
 
Przykład1: 
Badacz na podstawie zebranych danych skonstruował za pomocą analizy regresji model regresyjny, w którym wykazał zależność liniową pomiędzy poziomem inteligencji uczniów a ich uzyskiwanymi stopniami z matematyki. Dzięki temu, znając poziom inteligencji danego ucznia może on przewidywać, prognozować (z pewnym błędem) jego stopnie z matematyki. 
 
Przykład2: 
Ekonomista na podstawie wieloletnich badań stwierdził, że na podstawie wielkości inflacji można prognozować Wielkość stopy bezrobocia. Przeprowadził analizę regresji i wyprowadził model regresyjny. Dzięki tej analizie w przyszłości na podstawie wielkości inflacji mógł prognozować wielkość stopu bezrobocia (z założonym błędem) 
 
W opisanych powyżej przykładach powtarzają się pewne kwestie. Po pierwsze, regresja dotyczy sytuacji, w której na podstawie jednej zmiennej chcemy prognozować wartość innej zmiennej, co oznacza, że analiza regresji służy temu, aby stwierdzić, czy na podstawie danej zmiennej (bądź zestawu zmiennych) możemy przewidywać inną zmienną (zmienną zależną, objaśnianą) oraz jeżeli można to jaki model będzie najbardziej dokładny w swoich prognozach. Po drugie, w praktyce zawsze występuje pewna wielkość błędu oszacowania. Chodzi o to, że model prognozy zakłada pewien błąd oszacowania swoich prognoz. Im model jest "lepszy" tym ten błąd będzie mniejszy, im model będzie "gorszy" tym przewidywany błąd będzie większy. Modele regresyjne muszą zakładać wystąpienie błędu oszacowania, modele mogą się mylić o pewną wielkość. Ideą regresji jest zminimalizowanie tego błędu oszacowania do tego stopnia, aby model był przydatny w swoich prognozach. Posłużmy się przykładem: 
 
Dwóch badaczy skonstruowało modele regresji, który miały prognozować ceny benzyny na podstawie innych ekonomicznych danych. Jeden badacz stwierdził, że jego model przewiduje, prognozuje ceny paliw z błędem (z prawdopodobieństwem 95%) +/- 10 groszy. Drugi badacz skonstruował model, który przewiduje te same ceny z błędem +/- 50 groszy. Jak możemy zauważyć, błąd 50gr jest bardzo dużym błędem, zakładając taką jego wielkość można powiedzieć, że model praktycznie nie przewiduje wartości ceny, ponieważ jego błąd oszacowania jest na tyle duży, że w praktyce nie bliski w swoich prognozach odnośnie cen paliwa. Na podstawie tego drugiego modelu nie będzie można się opierać w innych założeniach ekonomicznych, bazujących na przewidywanej wartości ceny paliwa. 
 
Tak więc, model regresyjny możemy zawsze zbudować, jednakże tylko te modele będą "wartościowe", w których błąd oszacowania będzie relatywnie niski.

 

W modelach regresji należy podkreślić, że nie manipulujemy zmiennymi niezależnymi, ideą regresji jest pomiar zmiennych niezależnych (zwanymi predyktorami, zmiennymi objaśniającymi, wyjaśnianymi) i zmiennych zależnych (objaśnianych, wyjaśnianych). W regresji nie można mówić stricte o wpływie jednej zmiennej na drugą, ponieważ nie manipulujemy wartościami zmiennych. W regresji za pomocą zmiennej bądź zestawu zmiennych chcemy wyjaśnić jakąś inną zmienną, a nie wpływać na nią, ponieważ istotna zależność pomiędzy predyktorami a zmienną zależną może dotyczyć jedynie współwystępowania zmiennych a nie rzeczywistego wpływu jednej zmiennej na drugą. Analiza regresji wykorzystuje w obliczeniach korelacje stąd często modele regresyjne nazywane są modelami korelacyjnymi.

Wzór na ogólną postać regresji
 

Można zatem powiedzieć, że analiza regresji tworzy funkcję matematyczną opisującą zależność pomiędzy predyktorem (predyktorami) a zmienną zależną. 

Temat analizy regresji jest bardzo obszerny, istnieje wiele odmian regresji:

Analiza regresji - idea Wasze opinie

3+7 =