Muva (Fach) / Logistische Regression (Lektion)

In dieser Lektion befinden sich 9 Karteikarten

8. Vorlesung

Diese Lektion wurde von Amalaswinthaa erstellt.

Lektion lernen

  • Einfache logistische Regression - ein metrischer Prädiktor, eine dichotome AV - Beispiel für AVs: Klausurergebnis (bestanden ja nein), Aufgabe (gelöst/nicht), Eignung (geeignet/nicht) - untersucht, ob die Wahrscheinlichkeit für jede der beiden Kategorien von der Ausprägung der Prädiktorvariablen abhängt z.B. Wahrscheinlichkeit für "Klausur bestanden" abhängig von dem Prädiktor "Lernaufwand" (= Lernzeit in Std.)
  • Warum ein anderes Verfahren als bei multipler Regression? 1. Form der Funktion ungeeignet: Wertebereich Wahrscheinlichkeit: 0-1 2. Voraussetzung der Normalverteilung nicht erfüllt (AV dichotom) 3. Voraussetzung der Homoskedastizität nicht erfüllt
  • 3 Darstellungsweisen 1. Bedingte Wahrscheinlichkeiten 2. Wettquotient (Odds Ratio) 3. Logit - für jede Darstellungsweise ergibt sich eine andere Form der Funktion zwischen Prädiktor und Kriterium) - Regressionsparamter jeweils gleich - Interpretation der Regressionsparameter unterschiedlich
  • Formeln der 3 Darstellungsweisen 1. Bedingte Wahrscheinlichkeit: P(Y = 1 I X) = eβ0 + β1X / 1 + eβ0 + β1X 2. Wettquotienten: P(Y=1 I X)/ 1-P(Y=1I X) = eβ0 + β1X = eβ0 * eβ1X1 = eβ0 * (eβ1)x 3.Logit: ln ( P(Y=1 I X)/ 1-P(Y=1I X))= β0+ β1X1
  • Darstellung als bedingte Wahrscheinlichkeit - AV hat 2 Ausprägungen, die mit 0 und 1 bezeichnet werden Bsp. Klausur nicht bestanden = 0, bestanden = 1  Betrachtet werden die bedingten Wahrscheinlichkeiten: P(Y = 1 I X = x) und 1-P(Y = 0 I X = x) - sind komplementär, deshalb wird nur eine betrachtet, üblicherweise P(Y=1) - es wird eine Funktion gesucht, die die Abhängigkeit der Wahrscheinlichkeit von (Y = 1) von der Ausprägung der Prädiktorvariablen beschreibt "Wie ändert sich die Wahrscheinlichkeit für "Klausur bestanden" in Abhängigkeit von der Lernzeit?"
  • Bedeutung von ß0 - bestimmt die Wahrscheinlichkeit von P(Y = 1) für den Wert 0 von X "Wie wahrscheinlich ist ein Wert von Y = 1, wenn X den Wert 0 hat?" "Wie wahrscheinlich ist das Bestehen der Klausur, wenn Lernzeit = 0? für b0 = 0 ergibt sich: p = 0.5 --> p = eβ0 / 1+ eβ0 = 1 / 1 + 1
  • Bedeutung von ß1 - bestimmt die Steigung der Wahrscheinlichkeitsfunktion - wie stark wirken sich die Unterschiede in X auf die Wahrscheinlichkeit aus?  - je größer β1, desto stärker wirken sich die Unterschiede auf die Wahrscheinlichkeit von y aus, Kurve läuft dann steiler - bei positiven Werten von β1, nimmt die Wahrscheinlichkeit für y = 1 mit steigenden x-Werten zu - bei negativen Werten nimmt die Wahrscheinlichkeit ab - wenn β1 = 0, dann gibt es keinen Zusammenhang von p(y=1) und x, die Variablen X und Y sind dann unabhängig - je nach Wertebereich wirken sich die Unterschiede in X unterschiedlich stark auf die Wahrscheinlichkeit von < aus, da die Funktion keine lineare Funkfion ist - in der Mitte der Funktion (Wendepunkt) wirken sich die UNterschiede besonders stark aus, an beiden Rändern wenig
  • Parameterschätzung - Maximum-Likelihood-Verfahren; iteratives Verfahren - die beste Lösung kann nicht "berechnet" werden, sondern wird iterativ bestimmt, indem die Parameter in kleinen Schritten verändert werden und jeweils geprüft wird, ob sich die Lösung verbessert - Likelihoodfunktion beschreibt die Wahrscheinlichkeit für das Auftreten der in der Untersuchung vorliegenden Daten in Abhängigkeit von verschiedenen Ausprägungen der Regressionsparamter - Regressionsparamter, die zur größten Wahrscheinlichkeit führen, bilden die Lösung - weitere Annahme: das Modell passt überhaupt auf die Daten --> bedeutet, dass das Modell alle relevanten Prädiktoren enthält und keine nicht-relevanten Prädiktoren und, dass die Wahrscheinlichkeit von y sich überhaupt als logistische Funktion der Ausprägung von x beschreiben lässt - zur Überprüfung der Modellanpassungsgüte existieren versch. Tests (Devianztest, Hosmer-Lemeshow-Test)
  • Darstellung als Logit - logarithmierter Wettquotient - Vorteil: Analogie zur linearen Regression - Bedeutung: der Logit von y ist eine lineare Funktion von x - Bedeutung der konstanten β0: Logit an der Stelle X = 0 (analog Achsenabschnitt der linearen Reg.) - Bedeutung von β1: Änderung des Logits, wenn x um eine Einheit zunimmt (analog lineare Reg.) - wenn β1=0 dann kein Zusammenhang