Durchführung und Interpretation der Regressionsanalyse

Mit einer Regressionsanalyse überprüfst du ob ein Zusammenhang zwischen den Werten von zwei oder mehreren Variablen besteht, wie z. B. zwischen dem Gewicht und der Größe einer Person.

Dieser Zusammenhang wird bei einer Regressionsanalyse in Form eines Vergleichs getestet.

Dieser Vergleich zeigt die Veränderung der abhängigen Variable Gewicht, wenn sich der Wert der erklärenden (unabhängigen) Variable Größe um den Wert 1 erhöht.

Verwendung der Regressionsanalyse

Die 3 Hauptgründe für eine Regressionsanalyse sind:

1. Die Stärke des Zusammenhangs zwischen zwei Variablen herausfinden.

Beispiele
  • Wie stark ist der Zusammenhang zwischen der Größe und dem Gewicht einer Person?
  • Wie stark ist der Zusammenhang zwischen dem Alter und dem Wert eines Autos?

2. Die Veränderung der abhängigen Variablen voraussagen, wenn sich der Wert der erklärenden Variablen verändert.

Beispiele
  • Inwiefern verändert sich das Gewicht wenn sich die Größe einer Person verändert?
  • Inwiefern verändert sich der Wert eines Autos wenn sich das Alter des Autos ändert?

3. Einen zukünftigen Wert voraussagen.

Beispiele
  • Wie schwer ist ein 180 cm großer Mann?
  • Welchen Wert hat ein Auto, wenn es sechs Jahre alt ist?

Formen von Regressionsanalysen

Es gibt mehrere Formen von Regressionsanalysen:

Die Form der Regressionsanalyse hängt ab:

  • von der Anzahl der Variablen, die du testen möchtest
  • vom Skalenniveau der Variablen (Nominal-, Ordinal-, Intervall-, Verhältnisskala)

Bei einer einfachen linearen oder multiplen Regressionsanalyse muss die abhängige Variable intervall- oder verhältnisskaliert sein.

Fällt dir akademischer Schreibstil schwer?

Unsere Scribbr-Korrektoren korrigieren für dich:

  • den akademischen Ausdruck
  • Sprach- und Grammatikfehler
  • Interpunktion
  • den roten Faden
  • Quellenangaben

Beispiel anschauen

Einfache lineare Regressionsanalyse

Wenn du den Effekt einer erklärenden (oder unabhängigen) Variable auf eine abhängige Variable testen möchtest, verwendest du eine einfache lineare Regressionsanalyse.

Beispiel
Du möchtest das Gewicht einer Person (abhängige Variable Y) basierend auf der Größe einer Person (erklärende Variable X) vorhersagen oder erklären.

Eine einfache lineare Regression kann mit der folgenden Gleichung ausgedrückt werden:

Y = α + βX + u

Der Vergleich besteht aus drei Elementen:

  1. α – Der Interzept (Achsenabschnitt) ist der Startpunkt der Regressionsanalyse, die sogenannte Konstante. Das bedeutet, dass auch wenn die Größe 0 cm ist, gibt es ein Basisgewicht.
  2. β – Der Regressionskoeffizient zeigt die durchschnittliche Zunahme der abhängigen Variable Gewicht (Y) wenn die erklärende Variable Größe (X) sich um einen Zentimeter erhöht.
  3. u – Der Fehlerwert ist der Teil der abhängigen Variable, der nicht durch die unabhängige Variable erklärt werden kann.

Im Streudiagramm siehst du den linearen Anstieg der Größe bei zunehmendem Gewicht.

Die Linie nennt man Regressionsgerade und sie orientiert sich an den Datenpunkten der Stichprobe, die um sie streuen.

Streudiagramm

Multiple Regressionsanalyse

Multiple, oder auch mehrfache Regressionsanalyse genannt, ist eine Erweiterung der einfachen Regression. Dabei werden zwei oder mehrere erklärende Variablen verwendet um die abhängige Variable (Y) vorhersagen oder erklären zu können.

Beispiel
Du möchtest zusätzlich zur Größe die Variable Geschlecht verwenden um das Gewicht einer Person zu erklären.

Du fügst Geschlecht als deine zweite Variable (X2) hinzu.

Nun sieht die Regressionsgleichung so aus:

Υ = α + β1X+ β2X+ u

Der einzige Unterschied im Vergleich zur einfachen Regressionsanalyse ist, dass ein zweiter Regressionskoeffizient (β) für die erklärende Variable Geschlecht hinzugefügt wurde.

Regressionsanalyse mit SPSS, Excel oder Google-Tabellen durchführen

Regressionsanalysen kannst du mit Programmen wie SPSS, Excel oder Google-Tabellen durchführen.

Lade dir unsere SPSS-Datei herunter um die einfache lineare Regressionsanalyse selbst zu üben. Klicke im Menü auf:

  • Analysieren
  • Regression
  • Linear

In dem geöffneten Fenster verschiebe nun die Variable Gewicht in das Feld Abhängige Variable und die Variable Größe in das Feld Unabhängige Variable(n).

Mit Ok führst du du die Analyse aus.

Regressionsanalyse SPSS

SPSS

Lade dir unsere Excel-Datei um mit denselben Daten zu üben. Für die Analyse mit Excel benötigst du das Analyse Add-In.

Gehe dafür im Menü auf:

  • Extras
  • Excel-Add-Ins
  • Wähle Analyse-Funktionen aus

Um die Regressionsanalyse durchzuführen klicke auf:

  • Daten
  • Datenanalyse (rechtes äußerstes Feld)
  • Regression

Input Y Range: Wähle die Daten der abhängigen Variable YGewicht aus (inklusive dem Namen der Spalte).

Input X Range: Wähle die Daten der erklärenden Variable XGröße aus (inklusive dem Namen der Spalte).

Klicke auf Labels um anzugeben, dass die oberste Zelle jeweils der Name der Variablen ist.

Beachte: Möchtest du eine multiple Regression berechnen, wähle sowohl die Daten für die Variable Größe und Alter ins Feld Input X Range.

Unter Output Options wähle New Worksheet Ply. Dadurch werden dir die Ergebnisse in einem neuen Arbeitsblatt angezeigt. Du kannst es Regression nennen.

Klicke auf Ok um die Analyse durchzuführen.

Excel Analyse Add-In

Excel Add-In

Regressionsanalyse Excel

Excel

Mit unserer Google-Tabellen Datei kannst du die Regressionsanalyse ausprobieren. Bevor du statistische Berechnungen mit Google-Tabellen durchführen kannst, musst du ein Add-on installieren.

Klicke dafür im Menü auf:

  • Add-ons: Add-ons aufrufen
  • Suche nach XLMiner Analysis ToolPak und füge es hinzu dann klicke wieder auf
  • Add-ons und aktiviere das XLMiner Analysis ToolPak

Um die Regression zu berechnen wählst du in der Seitenleiste Lineare Regression aus.

Input Y Range: Wähle die Daten der abhängigen Variable YGewicht aus (inklusive dem Namen der Spalte).

Input X Range: Wähle die Daten der erklärenden Variable XGröße aus (inklusive dem Namen der Spalte).

Klicke auf Labels, um anzugeben, dass die oberste Zelle jeweils der Name der Variablen entspricht.

Unter Output Range markiere einen größeren Bereich unter der Tabelle.

Mit Ok erhältst du die Ergebnisse der Regressionsanalyse.

Regressionsanalyse Google-Tabellen

Google-Tabellen

Regressionsanalyse Interpretation der Ergebnisse

Die Ausgabe einer Regressionsanalyse besteht aus drei Teilen, der Modellzusammenfassung, der ANOVA und den Koeffizienten.

Wir erklären dir die SPSS-Ausgabe für dieses Beispiel. Die Ausgabe von Excel und Google-Tabellen ist sehr ähnlich.

Modellzusammenfassung

Die Modellzusammenfassung zeigt dir mit dem Korrelationskoeffizienten (R) die Stärke des Zusammenhangs und gibt zusätzlich den Wert des Determinationskoeffizienten an.

SPSS-Modellzusammenfassung

R: Der Korrelationskoeffizient gibt an wie hoch der Zusammenhang der beiden Variablen ist.

  • Interpretation: Der Korrelationskoeffizient ist mit 0,909 sehr hoch. Es besteht also ein sehr hoher Zusammenhang zwischen Gewicht und Größe.

R-Quadrat: Der Determinationskoeffizient gibt an wie sehr die Varianz der abhängigen Variable durch die erklärende Variable erklärt wird.

Der Wert dieses Koeffizienten liegt immer zwischen 0 und 1, wobei 1 das beste Modell wäre. Dann würde nämlich die gesamte Varianz durch die abhängige Variable erklärt werden.

Du kannst den Wert von R-Quadrat mit 100 multiplizieren um einen Prozent-Wert zu erhalten.

  • Interpretation: Ein R-Quadrat von 0,826 bedeutet, dass die Variable Größe 82,6% des Gewichts einer Person erklärt.

Beachte: Wenn du eine multiple Regression durchführst, schau dir das Korrigierte R-Quadrat anstelle des R-Quadrats an. Weil mehr erklärende Variablen immer auch mehr von der Varianz erklären können. Das Korrigierte R-Quadrat korrigiert diesen Fehler.

ANOVA

Der zweite Teil der Ausgabe, ANOVA, testet die Signifikanz des Regressionsmodells.

Die Ergebnisse zeigen wie hoch die Wahrscheinlichkeit ist, dass alle Regressionskoeffizienten tatsächlich 0 sind und das Resultat der Regressionsanalyse daher auf Zufall basiert.

ANOVA

F: F-Test

Um diese Annahme zu testen wird ein F -Test durchgeführt.

df: Degrees of freedom (Freiheitsgrade)

In den F -Test einbezogen werden Freiheitsgrade:

  • df = 1: Anzahl der erklärenden Variablen
  • df = 28: Zahl der Beobachtungen (30 Personen) minus der Anzahl der erklärenden Variablen (1) minus 1

Sig.: Signifikanz des Modells

Liegt dieser Wert unter 0,005 dann beinhaltet das Modell signifikante erklärende Variablen.

  • Interpretation: Die Wahrscheinlichkeit einen F -Wert von 132,863 oder größer mit diesen Freiheitsgraden (1,28) zu erhalten liegt bei 0,000. Das Modell beinhaltet daher signifikante Variablen (Größe).

Koeffizienten

Die Tabelle zu den Koeffizienten gibt Auskunft über die Größe, das Vorzeichen der Konstante (plus oder minus) und die Signifikanz des Effekts der erklärenden Variable auf die abhängige Variable.

Koeffizienten

T und Sig.: t-Test und Signifikanz

Die Signifikanz des Effekts wird mit einem t-Test ermittelt. Ein Ergebnis unter 0,005 ist signifikant.

  • Interpretation: Die Wahrscheinlichkeit einen t-Wert von 11,527 oder größer zu erhalten ist 0,000. Daher ist der Effekt signifikant.

Regressionskoeffizient B

Für die Regressionslinie sind die Werte des Regressionskoeffizienten B für die Konstante und die erklärende Variable Größe entscheidend.

Die Regressionslinie folgt der Gleichung:

Gewicht = -103,007 + 0,996 * Größe

  • Interpretation: Der geschätzte durchschnittliche Effekt einer Zunahme von einem Zentimeter an Größe ist 996 Gramm (0,996 kg * 1000).
Beispiel

Mit der Regressionsanalyse können wir das Gewicht aufgrund der Größe vorhersagen, wenn wir die Werte in die Regressionsgleichung einsetzen.Wir möchten abschätzen, wie schwer eine 180 cm große Person ist.

Gewicht = -103,007 + 0,996 * 180 = 76,27 kg

Eine 180 cm große Person ist geschätzt 76,27 kg schwer.

Beachte: Bei der multiplen Regression ist der Regressionskoeffizient die durchschnittliche Zunahme der abhängigen Variable während die anderen erklärenden Variablen gleich bleiben.

Regressionsanalyse Zusammenfassung der Ergebnisse

Du fasst die Ergebnisse der Regressionsanalyse im Ergebniskapitel deiner Bachelorarbeit oder Masterarbeit zusammen.

Darin hältst du auf jeden Fall fest:

  • Die erklärte Varianz deines Regressionsmodells (R2 oder R-Quadrat)
  • Den F -Wert und die Signifikanz deines Regressionsmodells
  • Den Regressionskoeffizienten und seine Signifikanz

Für die Zusammenfassung der Ergebnisse der Regressionsanalyse kannst du die folgenden Sätze verwenden:

Eine einfache lineare Regression mit Gewicht als der abhängigen und Größe als der erklärenden Variablen ist signifikant, F (1,28) = 132,86, p<, 001.

82,6% der Varianz von Gewicht kann mit der Variable Größe erklärt werden. Der Regressionskoeffizient der Variable Größe ist 0,996 und ist signifikant ( t (28) = 11,53; p <, 001).

Die Größe ist ein signifikanter Prädiktor für Gewicht. Die geschätzte Zunahme an Gewicht ist 996 Gramm pro Zentimeter (β = 0,996; t (28) = 11,53; p <, 001). Die Größe erklärt ebenso einen signifikanten Anteil der Varianz von Gewicht von (R2=, 826; F (1,28) = 132,86, p <, 001).

Statistische Voraussetzungen für die Regressionsanalyse

Damit deine Regressionsanalyse gültige Ergebnisse liefert, müssen einige statistische Voraussetzungen erfüllt sein.

Diese Voraussetzungen werden Gauss-Markov Annahmen genannt:

  • Die Beziehung zwischen der erklärenden und der abhängigen Variable ist linear.
  • Die Daten wurden mittels Zufallsstichprobe aus der Grundgesamtheit gezogen.
  • Die unabhängigen Variablen, die du in die Regressionsanalyse einschließt, weisen keine lineare Beziehung auf.
  • Exogenität: der erwartete Wert des Fehlers ist 0.
  • Homoskedastizität: Die Varianz des Fehlerwertes ist für alle Werte der erklärenden Variablen gleich.
War dieser Artikel hilfreich?
Priska Flandorfer

Priska arbeitet im Bereich Content Writing. Sie ist promovierte Sozialwissenschaftlerin und hilft gerne anderen Studierenden beim Bestehen ihrer Abschlussarbeiten.

1 Kommentar

Priska Flandorfer
Priska Flandorfer (Scribbr-Team)
1. April 2019 um 19:04

Danke fürs Lesen! Ich hoffe dieser Artikel hat dir weitergeholfen. Hast du noch eine Frage? Hinterlasse einen Kommentar und ich werde mich so schnell wie möglich bei dir zurückmelden.

Hinterlasse einen Kommentar oder eine Frage