Multivariate Statistik (Fach) / 3. ALM & Varianzanalyse (Lektion)
In dieser Lektion befinden sich 20 Karteikarten
Allgemeines lineares Modell & ANOVA I & II
Diese Lektion wurde von Frena erstellt.
Diese Lektion ist leider nicht zum lernen freigegeben.
- Wozu dient das allgemeine lineare Modell? Das ALM soll Merkmalsunterschiede in abhängigen Variablen (AV) durch Linearkombinationen von unabhängigen Variablen (UV) erklären.
- Was sind Eigenschaften des allgemeinen linearen Modells? Das ALM ist additiv. Die einzelne Prädiktoren werden gewichtet und aufsummiert um das Kriterium vorherzusagen. Das ALM ist linear im Modellgewicht (𝛽). Das heißt, dass die Modellgewichte 𝛽0 nur in erster Potenz vorkommen. Die Prädiktoren (x) selbst hingegen müssen nicht linear zum Kriterium sein (z.B. auch bei kategorialen Daten). Das ALM ist invariant. Die Modellgewichte werden für alle Personen bestimmt, nicht für einzelne Personen. Das ALM ist kompensatorisch. Hohe Werte in einer Prädiktorvariable können niedrige Werte in andern Prädiktorvariablen ausgleichen.
- Was prüft die Varianzanalyse? --> ob sich mehr als zwei Gruppen bzgl. ihres Mittelwertes unterscheiden. AV: metrisch UV: kategorial (--> Faktoren/Faktorstufen) Beispiele: Unterscheiden sich die Patienten, die mittels verschiedener Therapieformen behandelt wurden, in ihrem Depressionscore nach der Therapie? Unterscheiden sich die Reaktionszeiten im Straßenverkehr bei verschiedenen Ablenkungsmodi? Verhalten sich Babys in Bezug auf ihre Lächelrate unterschiedlich, je nachdem welches Familienmitglied mit ihnen interagiert? Anwendungsgebiete: v.a. in der experimentellen Psychologie
- Berechnung einfaktorielle Varianzanalyse: Quadratsummenzerlegung Die Varianz der abhängigen Variablen wird in Varianzkomponenten zerlegt: Unterschiedlichkeit der Gruppenmittelwerte: Quadratsummezwischen Fehlervarianz der Messungen innerhalb der einzelnen Gruppen: Quadratsummeinnerhalb Anschließend: Vergleich der Varianzen der einzelnen Faktorstufen mit der Gesamtvarianz. Ist die Varianz der einzelnen Faktorstufen wesentlich größer als die zufällige Gesamtvarianz in den Daten, dann hat der Faktor einen signifikanten Einfluss.
- Effektgröße Als Effektgröße kann der Anteil der systematischen Varianz an der Gesamtvarianz angegeben werden (?2 = QSzw / QStotal). ?2 kann Werte zwischen 0 und 1 annehmen.
- Hypothesen ANOVA: Wie lässt sich prüfen, ob sich die Gruppenmittelwerte bzw. Treatmenteffekte unterscheiden? Modell in Erwartungswertsdarstellung: Populationsmodell: 𝑥ij = 𝜇𝑗 + 𝜀ij 𝑯𝟎: Alle Populationsmittelwerte sind gleich --> 𝜇1 = 𝜇2 = 𝜇3 oder allgemein: 𝜇𝑎 = 𝜇𝑏 für alle Paare. 𝑯𝟏: Mind. zwei Populationsmittelwerte unterscheiden sich --> 𝜇𝑎 ≠ 𝜇𝑏 für mind. ein Paar. Modell in Effektdarstellung: Populationsmodell: 𝑥ij = 𝜇 + 𝑡𝑗 + 𝜀ij 𝑯𝟎: Alle Treatmenteffekte sind gleich 0 --> 𝑡𝑗 = 0 für alle j.𝑯𝟏: Mind. einer der Treatmenteffekte weicht von 0 ab --> 𝑡𝑗 ≠ 0 für mind. ein j.
- Zwei unterschiedliche Schätzungen der Residualvarianz Mittel der Quadratsummen innerhalb der Gruppen (MQSinn) --> eine über alle Gruppen gemittelte Schätzung der Residualvarianz. Mittel der Quadratsummen zwischen den Gruppen (MQSzw)
- ANOVA: Wozu F-Test? Unter H0 sind beide Varianzen, MQSinn und MQSzw, Schätzungen der Residualvarianz und daher müssen sie in der Population gleich sein. Wenn H0 nicht gilt, ist MQSzw größer als MQSinn. Ein F-Test überprüft, ob MQSzw größer als MQSinn ist oder nicht. --> F > 1 oder F = 1 ?
- ANOVA: Voraussetzungen F-Test Um die F-Verteilung nutzen zu können, müssen drei Voraussetzungen für die Residuen gelten: Unabhängigkeit der Werte: innerhalb und zwischen den Gruppen Normalverteilung Homoskedastizität (Varianzhomogenität)
- Wann nutzt man die zweifaktorielle Varianzanalyse? Wenn in einem psychologischen Experiment die Versuchsbedingungen nach 2 unabhängigen Variablen variieren
- Hypothesen zweifaktorielle ANOVA Nullhypothesen: Alle Gruppenmittelwerte der 1. UV sind gleich (Haupteffekt) --> H0 = μ1. = μ2. = ... = μk. Alle Gruppenmittelwerte der 2. UV sind gleich (Haupteffekt) --> H0 = μ.1 = μ.2 = ... = μ.k Es gibt keinen Interaktionseffekt --> H0: μij = μi. + μj. - μ.. oder H0: μij - (μi. + μj. - μ..) = 0 Alternativhypothesen: H1: mind. 2 Mittelwerte unterscheiden sich bzw. eine Interaktion liegt vor.
- Interaktionseffekte (= Wechselwirkungseffekte) betrachten die Wirkung eines Faktors (UV A) in Abhängigkeit von einem anderen Faktor (UV B). Haupteffekte: Die Anzahl der Haupteffekte entspricht der Anzahl der Faktoren, die untersucht werden können. In 2x2-faktoriellen Designs können 2 Haupteffekte geprüft werden. Beispiel: Haupteffekt A: Beeinflusst Frustration die Aggression? Und Haupteffekt B: Beeinflusst Hitze die Aggression? Interaktionseffekte: werden in Hypothesen formuliert. Diese beziehen sich auf die differentielle Wirkung eines Faktors, d.h. ob die Wirkung abhängig ist von der Art der Faktorstufenkombination. Zur Überprüfung der Hypothesen über Interaktionseffekte (sowie Haupteffekte) ermittelt man die Signifikanz der Effekte mittels mehrfaktorieller Varianzanalyse. 3 typische Interaktionsmuster in zweifaktoriellen Designs: 1. Ordinale Interaktion: Beide Haupteffekte sind global interpretierbar. Die Mittelwerte unterscheiden sich bei beiden Faktoren in beiden Stufen. gleicher Trend beider Linien in beiden Diagrammen (z.B.: links beide steigend, rechts beide fallend). --> Damit werden beide Haupteffekte eindeutig interpretierbar. Eine Interaktion kann in geringem Maß auftreten, sie ist aber vergleichsweise wenig bedeutsam. Bei parallelem Verlauf der Linien entfällt der Interaktionsanteil. 2. Hybride Interaktion: Einer der Haupteffekte ist nicht global interpretierbar. Interaktion deutlich ausgeprägt. Bei einem Faktor weisen die Linien den gleichen Trend auf: beide Mittelwerte in Stufe 2 sind kleiner als beide in Stufe 1 (beide absteigend, trotz möglicher Kreuzung der Linien) --> Haupteffekt ist global interpretierbar. Bei anderem Faktor weisen die Linien einen entgegengesetzten Trend auf --> Haupteffekt ist nicht global interpretierbar. 3. Disordinale Interaktion: Keiner der Haupteffekte ist global interpretierbar. Entgegengesetzter Trend in beiden Faktoren. stark ausgeprägte Interaktion, kann jedoch, selbst wenn Haupteffekte signifikant sind, nicht sinnvoll interpretiert werden. Die Interpretation der Effekte muss hier vom Interaktionseffekt ausgehen und die Unterschiede der Stufen berücksichtigen. V.a. bei der hybriden und disordinalen Interaktion sinnvoll, die Wirkung der Faktoren auf Zellenebene zu betrachten oder sie grafisch in Diagrammen zu veranschaulichen. So sieht man auf einen Blick, ob eine Interaktion vorliegt und welcher Art sie ist.
- Zweifaktorielle Varianzanalyse: Quadratsummenberechnung Typ I: Effekte werden in der Reihenfolge geschätzt, in der sie im Modell stehen Übliche Fragestellung: Klärt der Bildungshintergrund der Eltern Varianz am Mathecore auf, die über den IQ hinausgeht? 1. Prädiktor: Klärt die gesamte Varianz auf, die sich durch die Variable am Kriterium erklären lässt. 2. Prädiktor: Klärt nur die zusätzliche Varianz am Kriterium auf. Zuerst werden Haupteffekte geschätzt, dann Interaktionen. Die Reihenfolge der Prädiktoren beeinflusst die geschätzten Parameter. Wann? Bei Kontrolle von Störvariablen; bei methodisch begründeter Reihenfolge der Prädiktoren (z.B. bei kausalen Annahmen). Typ II: Effekte werden unter Berücksichtigung der anderen Haupteffekte geschätzt, Interaktionen bleiben unberücksichtigt Übliche Fragestellung: Klären der Bildungshintergrund der Eltern und der IQ Varianz am Mathescore auf? 1. Prädiktor: Klärt den Anteil an Varianz auf, der sich durch die Variable am Kriterium erklären lässt abzüglich der gemeinsamen Varianz (der HE/aller Effekte). 2. Prädiktor: Klärt auch den eigenen Anteil auf, abzüglich der gemeinsamen Varianz (der HE/aller Effekte). --> Jeder Prädiktor bekommt eine Varianz unter gleichzeitiger Berücksichtigung der anderen Haupteffekte zugeschrieben. Soweit Interaktionseffekte vorhanden sind, werden Haupteffekte überschätzt. Die geschätzten Parameter sind unabhängig von Reihenfolge der Parameter im Modell. Wann? Klassisches, exploratives Vorgehen. Standardeinstellung in R. Typ III: Effekte werden unter Berücksichtigung aller anderen Prädiktoren (Haupteffekte & Interaktionen) geschätzt Übliche Fragestellung: siehe Typ II 1. und 2. Prädiktor: siehe Typ II --> Jeder Prädiktor bekommt einen Anteil erklärter Varianz unter gleichzeitiger Berücksichtigung aller anderen Effekte zugeschrieben. Die geschätzten Parameter sind unabhängig von Reihenfolge im Modell. Wann? Klassisches, exploratives Vorgehen. Standardeinstellung in SPSS.
- Post-hoc Test Der F-Test ist ein Omnibus-Test --> es wird nur ermittelt, OB Mittelwertunterschiede vorliegen, aber nicht, WO diese liegen. Um Unterschiede zu finden, können post-hoc Analysen durchgeführt werden. Post-hoc Tests sind ein exploratives und globales Verfahren zur Suche von Mittelwertunterschieden. Alle Gruppen werden paarweise auf Mittelwertdifferenzen getestet / miteinander verglichen. Die Prüfgröße für den Vergleich von zwei Gruppen berechnet sich anhand der Mittelwerte. In die Prüfgröße geht die Residualvarianz 𝑀QSinn als Fehlervarianz ein.
- Alphafehlerniveau-Kumulierung Beim multiplen Testen erhöht sich die Wahrscheinlichkeit, einen Fehler erster Art zu begehen, mit jedem weiteren Test. Die Wahrscheinlichkeit, mindestens eine Fehlentscheidung zu treffen, ist die Gegenwahrscheinlichkeit dazu, nur richtige Entscheidungen zu treffen: (1 - αfestgelegt)Anzahl der Tests, --> daher: kumuliertes Alpharisiko = 1 - (1 - αfestgelegt)Anzahl der Tests Beispiel: 3 Tests (3 Variablen): = 1 - (1 - 0,05)3 = 1 - 0,86 = 14% 10 Tests (10 Variablen): = 1 - (1 - 0,05)10 = 1 - 0,60 = 40% Korrekturformeln: Sidak-Adjustierung Bonferroni-Adjustierung
- Wozu wird im ALM kodiert und welche Kodierungsarten gibt es? Abhängig von der Kodierungsart müssen die Modellgewichte unterschiedlich interpretiert werden. Hierdurch können verschiede spezifische Hypothesen geprüft werden. Kategoriale Variablen müssen geeignet kodiert werden, damit sie in ein lineares Modell aufgenommen werden können. (--> macht Software) Mit einer geeigneten Kodierung lassen sich Hypothesen über Mittelwertsunterschiede testen, als Alternative zu den explorativen Post-hoc Tests. Für alle Ausprägungen der UV wird ein Prädiktor erstellt. Der F-Test des Modells hat unabhängig von der Kodierung denselben Wert. --> Mit der Wahl der richtigen Kodierung lässt sich multiples Testen vermeiden. Kodierungsarten: Dummykodierung Effektkodierung (ungewichtet; gewichtet/bei ungleichen Gruppengrößen) Kontrastkodierung (orthogonal)
-
- Dummykodierung Die Dummykodierung ist die häufigste Kodierungsart im ALM. Hierbei wird ein Prädiktor weniger erzeugt, als man Ausprägungen der UV vorliegen hat. Alle Gruppen werden jeweils mit einer Referenzgruppe verglichen. Wann anwenden? --> beonsers geeignet, wenn eine Gruppe mit den anderen verglichen werden soll (z.B. bei einem Kontrollgruppendesign). 𝛽0 ist der Mittelwert der AV in der jeweiligen UV-Ausprägung (Referenzgruppe), die durch keine eigene Kodierungsvariable angesprochen wird. Die anderen Modellparameter (𝛽1,..., 𝛽𝑘−1) können als Unterschied zur Referenzgruppe interpretiert werden.
- Effektkodierung ähnelt der Dummykodierung, aber: Der Intercept ist der Gesamtmittelwert und die Prädiktoren bedeuten den Abstand der Gruppenmittelwerte zum Gesamtmittelwert. Daher wird ein Prädiktor weniger erzeugt, als man Ausprägungen der UV vorliegen hat. Die Gruppenmittelwerte ergeben sich durch die Modellgleichung. Ungewichtete Effektkodierung 𝛽0 ist der ungewichtete Mittelwert Die Modellgewichte (𝛽1,..., 𝛽𝑘) sind der Abstand zum ungewichteten Mittelwert (ohne Berücksichtigung der Gruppengröße) --> Die Effektkodierung ist sinnvoll, wenn die UV-Ausprägungen mit dem Gesamtmittelwert verglichen werden sollen. Effektkodierung bei ungleichen Gruppengrößen Eine ungewichtete Effektkodierung ist nur sinnvoll interpretierbar, wenn die Gruppen der UV- Ausprägungen gleich oder sehr ähnlich verteilt sind. Ansonsten sollte eine gewichtete Effektkodierung vorgenommen werden. Hierbei wird in der Referenzkategorie die Anzahl der Beobachtungen der unterschiedlichen Gruppen (EG, 𝑛𝑥𝑗) durch die Beobachtungen in der KG (/Referenzgruppe, 𝑛𝑅) geteilt (mit negativem Vorzeichen).
- Kontrastkodierung --> orthogonal Bei der Kontrastkodierung werden spezifische Hypothesen getestet, wie: UV - Ausprägung A > UV - Ausprägung B > UV - Ausprägung C Hierfür müssen die einzelnen Kodierungen so gewählt sein, dass Sie diese Relationen (größer/kleiner) modellieren. Für die oben genannte Hypothese würde man erst testen, ob sich C von A + B unterscheidet, und dann überprüfen, ob sich A und B unterscheiden. Wie werden orthogonale Kontraste aufgestellt? Regeln: Regel 1: Die Summe der Kodierung in jedem Prädiktor muss 0 sein. Regel 2: Die Produkte der Kodierungen müssen in der Summe 0 sein. Regel 3: Die Differenz der negativen und der positiven Kodierungen muss in jedem Prädiktor 1 sein. --> Bei Einhaltung dieser Regeln ist die Wahl der Kontraste beliebig! Die Modellparameter (𝛽1,…, 𝛽𝑘) stellen die Unterschiede zwischen den Prädiktoren gemäß der gewählten Kontraste dar. Der Intercept (𝛽0) ist der ungewichtete Mittelwert. Wann wird die Kontrastkodierung angewendet? --> wenn spezifische Trendhypothesen (A > B > C) vorliegen.
- Was ist der Intercept? = Achsenabschnitt, also die Schnittstelle mit der y-Achse. ergibt sich aus dem Mittelwert des Kriteriums abzüglich der Mittelwerte der Prädiktoren.