Statistik (Subject) / Regressionsanalyse (Lesson)

There are 3 cards in this lesson

3

This lesson was created by LernenLernen94.

Learn lesson

  • Grundlagen Regressionsgerade können sich hinsichtlich Achsenabschnitt und Steigung unterscheiden bei Steigung von b = 0, so leistet der Prädiktor keinen Beitrag zur Erklärung des Kriteriums Wert einer metrischen Kriteriumsvariable Y (=abhängige Variable) durch eine metrische Prädiktorvariable X (=unabhängige Variable) zu erklären (kein kausaler Anspruch verbunden)   statistischer Einfluss von x auf y anhand einer Gerade durch die Punktewolke anhand der Gerade kann man schätzen, welcher y-Wert bei einem bestimmten x-Wert vorliegen sollte Ŷ = mx + t + E   Ŷ = vorhergesagter (geschätzter) Y-Wert m = Steigung der Geraden (häufig mit b bezeichnet) x = Prädiktor t = Achsenabschnitt E = Fehlerwert   Steigung b der Geraden quantifiziert die Stärke des Einflusses des Prädiktors X auf das Kriterium Y größere Werte von b sprechen für größeren Einfluss von X auf Y Regression liefert nur präzise Ergebnisse, wenn Voraussetzungen erfüllt sind: Vorhersagefehler sind normalverteilt Varianz von Y ist für alle X-Werte etwa gleich Y-Werte sind unabhängig voneinander
  • Güte der Anpassung („fit“) Vorhersage hat nur dann Wert, wenn die Güte der Vorhersage (bzw. Vorhersagefehler) bekannt ist/bestimmt werden kann durch Regression lassen sich die Y-Werte genauer vorhersagen als durch den Mittelwert Vorhersagefehler wird kleiner einzelne „Gesamt-Abweichungsbalken“ bezeichnet man als Quadratsummen (SS) SST: Summe der quadrierten Differenzen zwischen erworbenen Daten und dem Mittelwert von Y Gesamt-Varianz, maximale Streuung, totale Fehlerstreuung) SSE: Summe der quadrierten Differenzen zwischen erworbenen Daten und der Regressionsgeraden Gesamt-Vorhersage-Fehler, Summe der Abweichung von der Regressionsgeraden SSM: Summe der quadrierten Differenzen zwischen dem Mittelwert von Y und Regressionsgeraden Verbesserung durch das Modell   prüfen, wie gut ein Regressionsmodell im Schnitt das Kriterium vorhersagt Abweichungen von vorhergesagten Ŷi und tatsächlichen Kriteriumswerten Yi berechnen SST = SSM + SSE  bei SSM > 0 kann die Kriteriumsvariable durch SSM besser vorhergesagt werden als durch Mittelwert ·         R² = Bestimmtheitsmaß; wie viel Prozent der Variation in der Kriteriumsvariable durch die Variation der X-Werte linear erklärt wird R² = SSM / SST
  • Multiple Regression Pfadmodell Prädiktoren (Ursachen / unabhängige Variablen) – Ehejahre + Ehezufriedenheit Kriterium (Wirkung / abhängige Variable) – Anzahl Affären   Pfaddiagramm stellt dar, welche Variablen in Zusammenhang stehen, ob der Zusammenhang kausal gerichtet ist, und ob positiv oder negativ Regressionsanalysen sind keine hinreichende Prüfung für Kausalhypothesen   Idee: Wert einer Kriteriumsvariable durch mehrere Prädiktorvariablen vorherzusagen, dabei hat jeder Prädiktor ein Einflussgewicht – ist mehreren einfachen Regressionen daher vorzuziehen) Stärke und Richtung des Einflusses eines Prädiktors kann sich ändern, wenn weitere Prädiktoren in die Regressionsanalyse aufgenommen werden in R: genau wie einfache Regression