Jak przeprowadzić regresję liniową w Excelu (pakiet analizy danych)?

Regresja liniowa to metoda statystyczna służąca do modelowania zależności między zmienną zależną (Y) a jedną lub więcej zmiennymi niezależnymi (X). W Excelu najłatwiej przeprowadzić pełną analizę regresji za pomocą wbudowanego dodatku Pakiet analizy danych (ang. Data Analysis ToolPak).

Krok 1: Aktywacja Pakietu analizy danych

Jeśli nie widzisz opcji "Analiza danych" w zakładce Dane, musisz najpierw aktywować dodatek:

  1. Przejdź do Plik -> Opcje.
  2. W oknie Opcje Excela wybierz Dodatki.
  3. Na dole okna, obok pola Zarządzaj, wybierz Dodatki programu Excel i kliknij Przejdź.
  4. W oknie Dodatki zaznacz pole wyboru Pakiet analizy (ang. Analysis ToolPak) i kliknij OK.

Po aktywacji, w zakładce Dane powinna pojawić się sekcja Analiza z przyciskiem Analiza danych.

Krok 2: Przygotowanie danych

Uporządkuj swoje dane tak, aby zmienna zależna (Y) i zmienna niezależna (X) znajdowały się w sąsiadujących kolumnach. Na przykład, chcąc przewidzieć Sprzedaż (Y) na podstawie Wydatków na reklamę (X).

A (Wydatki X) B (Sprzedaż Y)
1000 50000
1500 65000
800 45000

Krok 3: Przeprowadzenie analizy regresji

  1. Przejdź do zakładki Dane i kliknij Analiza danych.
  2. Z listy narzędzi analitycznych wybierz Regresja (ang. Regression) i kliknij OK.
  3. Wprowadź zakres Y: W polu Zakres wejściowy Y (ang. Input Y Range) zaznacz kolumnę ze zmienną zależną (np. $B$1:$B$50).
  4. Wprowadź zakres X: W polu Zakres wejściowy X (ang. Input X Range) zaznacz kolumnę ze zmienną niezależną (np. $A$1:$A$50).
  5. Nagłówki: Jeśli zaznaczyłeś nagłówki kolumn w kroku 3 i 4 (co jest zalecane), zaznacz pole wyboru Etykiety.
  6. Poziom ufności: Domyślnie wynosi 95%, ale możesz go dostosować.
  7. Opcje wyjściowe: Wybierz, gdzie mają zostać umieszczone wyniki:
    • Zakres wyjściowy: Wskaż pustą komórkę (np. D1), w której rozpocznie się tabela wyników.
    • Nowy arkusz: Umieść wyniki w nowym arkuszu.
  8. Wykresy: Zaznacz opcje takie jak Wykres linii dopasowania (ang. Line Fit Plot) i Wykresy rezydualne, aby wizualizować dane.
  9. Kliknij OK.

Krok 4: Interpretacja wyników

Excel wygeneruje obszerną tabelę wyników. Oto kluczowe elementy do interpretacji:

Statystyki regresji (Regression Statistics)

  • R-kwadrat (R Square): Mówi, jaki procent zmienności zmiennej Y jest wyjaśniany przez zmienną X. Wartość bliska 1 oznacza bardzo dobre dopasowanie modelu.
  • Wielokrotny R (Multiple R): Pierwiastek kwadratowy z R-kwadrat. Mówi o sile korelacji.

Współczynniki (Coefficients)

Ta sekcja zawiera parametry, które tworzą równanie regresji: $Y = aX + b$.

  • Przecięcie (Intercept): To jest $b$ (wyraz wolny). Jest to teoretyczna wartość Y, gdy X wynosi 0.
  • Wydatki X (lub nazwa Twojej zmiennej X): To jest $a$ (współczynnik nachylenia). Mówi o tym, o ile jednostek zmieni się Y, gdy X wzrośnie o jedną jednostkę.
Wnioski: Jeśli współczynnik nachylenia wynosi 50, oznacza to, że każde dodatkowe 1 zł wydane na reklamę (X) prowadzi do wzrostu sprzedaży (Y) o 50 zł.

Istotność statystyczna

  • Wartość P (P-value): Sprawdź wartość P dla Twojej zmiennej X. Jeśli jest mniejsza niż 0,05, oznacza to, że zależność między X a Y jest istotna statystycznie.

Komentarze

Popularne posty z tego bloga

Analiza danych z użyciem Power Query w Excelu

Analiza statystyczna za pomocą wbudowanych funkcji Excela

Importowanie Danych z Innych Aplikacji do Excela