R²Der Anteil der Varianz in y, die durch eine OLS Regression durch x aufgeklärt werden kann; ein Indikator also, wie gut das Modell zu den Daten passt.
LinearitätOLS Regression schätzen die beste Gerade als Modell, das einen Zusammenhang beschreibt. Wenn der Zusammenhang aber nicht linear ist, ist die OLS Regression ein fragliches Modell.
SubgruppenWenn die untersuchte Beziehung für Untergruppen unterschiedlich ausfällt, ist der allgemeine Zusammenhang über alle hinweg tendenziell verzerrt.
ExtrapolationVorhersagen in Bereiche, in denen es keine tatsächlich beobachteten Fälle gibt.
Dummy VariableEine kategoriale Prädikatorvariable mit den zwei Ausprägungen 0 (Referenzgruppe) und 1. Mittels Dummy Variablen lassen sich Durchschnittsunterschiede schätzen.
Regression zur MitteWeil Korrelationen de Facto immer kleiner sind als 1, tendiert jeder vorhergesagte Wert ˆy dazu, weniger Standardabweichungen von seinem Mittelwert ¯y entfernt zu liegen, als das dazugehörige x von ...
Kausale versus deskriptive Interpretation der OLS ...Regression berechnen Steigungen, d.h. die Zunahme von y,wenn x um eine Einheit steigt. Dennoch sollten wir uns huten, ¨die Steigungen kausal zu interpretieren. Stattdessen sollte dieRegression als ein ...
ScheinkorrelationWenn eine Drittvariable sowohl mit der abhängigen Variable y, als auch dem interessierenden Prädiktor x korreliert, verzerrt sie die Stärke des Zusammenhangs y, x.
Konfundierende VariablenVerzerren Zusammenhang x, y, bzw. verursachen Scheinkorrelationen. Sollten als Drittvariable konstant gehalten werden.
Frisch-Waugh-Lovell Theorem: Die multiple OLS Regression kommt zum gleichen Ergebnisse, als wurde man in mehreren Schritten zunächst die Einflusse aller Drittvariablen auf die abhängige Variable y und den Prädiktor von Interesse ...
Multiple OLS RegressionEine OLS Regression mit mehreren k Prädiktoren, die die Summe der quadrierten Residuen minimieren.
Drittvariablen KontrolleWas eine multiple OLS Regression bei der Drittvariablen-Kontrolle technisch macht, kann durch drei Perspektiven gut nachvollzogen werden: a) das Frisch-Waugh-Lovell Theorem, b) die paratial Ableitung ...
Mediirende Variable / Mediator Mediierende Variable/Mediator: “Vermitteln”/Erklären als Mechanismen Zusammenhang x, y. Konstanthaltung als Drittvariable verzerrt Zusammenhang x, y.
MulitkolinearitätMulticollinearität: Wenn einer oder mehrere der Prädiktoren selbst sehr gut (R2 > 0.9) durch manche oder mehrere der anderen Prädiktoren vorhergesagt werden können. Konsequenz sind unverlässliche ...
Adjustieres R²Adjusted R2: Kennzahl die ausdruckt wie viel der Varianz einer abhängigen Variable eine multiple OLS Regression aufklärt. Im Gegensatz zum normalen R2, wird die Kennzahl jedoch für die Anzahl der Prädiktoren ...
ZufallErgebnis ist nicht vorhersagbar, hat aber angebbareWahrscheinlichkeiten.
ExperimentZuf¨allige Zuweisung (Randomisierung) zuExperimentalgruppen mit anschließender Intervention undKontrolle.
RepräsentativWenn die Sch¨atzer die Populationsparameterakkurat reflektieren. Wird auch “extern valide” genannt.
VerzerrtWenn Stichproben systematisch unrepr¨asentativ sind(nicht extern valide), oder wenn kausale E!ekte aufGrundlage systematisch ungleicher Gruppen gesch¨atzt werden(nicht intern valide).
Zufallsstichprobem-VariabilitätNaturliche Tendenz von ¨Zufallsstichproben sich jeweils in zuf¨alliger Hinsicht voneinander zu unterscheiden und zuf¨allig von derRepr¨asentativit¨at abzuweichen
PopulationsparameterEin numerisches Attribut einer(Gesamt-)Population, z.B. das durchschnittliche Alter inDeutschland; ist und bleibt meist unbekannt.
Statistik /SchätzerAus Zufallsstichproben gesch¨atzter Wertfur einen Populationsparameter
ZufallsvariableWenn die Werte einer Variable das Ergebniseines Zufallsvorgangs sind.
Erwartungswert E(x)Der theoretisch-langfristige (beiunendlichen Wiederholungen) Mittelwert einer Zufallsvariable.Der Erwartungswert ist der wahre Mittelwert in einerPopulation: E(x) = µ.
WahrscheinlichkeitsverteilungVerteilung einer Zufallsvariable.Die Fl¨ache unter der Wahrschienlichkeitsverteilung gibt dieWahrscheinlichkeit an und ist insgesamt immer 1.
Law of large numbersDie relative H¨aufigkeit einesEreignisses n¨ahert sich der wahren Wahrscheinlichkeit desEreignisses an, je mehr unabh¨angige Runden/Ziehungendurchgefuhrt werden
WahrscheinlichkeitDie Wahrscheinlichkeit eines Ereignissesist seine langfristige (æ Œ) relative H¨aufigkeit.
StichprobenverteilungZeigt die Verteilung einerStatistik/eines Sch¨atzers uber alle denkbaren ¨Zufallsstichproben.
Central Limit TheoremDie Stichproben-Verteilung vonMittelwerten (& relativen h¨aufigkeiten, —, ...) n¨ahert sichder Normal-Verteilung, je gr¨oßer die Zufallsstichprobe, egalwie die eigentliche Variable verteilt ist, ...
NormalverteilungEine nutzliche, symmetrische ¨Wahrscheinlichkeitsfunktion die durch ihren Mittelwert undihre Standardabweichung definiert ist.
StandardfehlerDie Standardabweichung derStichproben-Verteilung gesch¨atzt auf Bais einer konkretenZufallsstichprobe. Weil der Mittelwert derStichproben-Verteilung der wahre Wert der Population ist,sind Abweichungen ...
95% KonfidenzintervallIntervall, das mit einerZuverl¨assigkeit von 95% der wahre Populationswertbeinhaltet. Typische Berechnung: Sch¨atzer ± Fehlertoleranz.Berechnung von Konfidenzintervallen mit anderenZuverl¨assigkeiten ...
Kritischer WertDie Anzahl Standardfehler links und rechtsvom Mittelwert der Stichproben-Verteilung, die mit demgewunschten Niveau an Sicherheit/Konfidenz ¨korrespondieren, meist 1.96 → 95%.
FehlertoleranzDer kritischer Wert multipliziert mit demStandardfehler. Von einem Konfidenzintervall, das Ausmaßdes Intervalls jeweils auf einer Seite von der gesch¨atztenStatistik. Kleine Fehlertoleranzen stammen ...
68, 95, 99,7-RegelDie Fl¨achen unter der Normal-Verteilungeine, zwei, bzw. drei Standardabweichungen nach links undrechts vom Mittelwert umfasen circa 68, 95 & 99,7 Prozentder Gesamtfl¨ache unter der Normalverteilung. ...
Stichproben- VerteilungZeigt die Verteilung einerStatistik/eines Sch¨atzers uber alle denkbaren ¨Zufallsstichproben.
Central Limit TheoremDie Stichproben-Verteilung vonMittelwerten (& relativen h¨aufigkeiten, —, ...) n¨ahert sichder Normal-Verteilung, je gr¨oßer die Zufallsstichprobe, egalwie die eigentliche Variable verteilt ist, ...
NormalverteilungEine nutzliche, symmetrische ¨Wahrscheinlichkeitsfunktion die durch ihren Mittelwert undihre Standardabweichung definiert ist.
StandardfehlerDie Standardabweichung derStichproben-Verteilung gesch¨atzt auf Bais einer konkretenZufallsstichprobe. Weil der Mittelwert derStichproben-Verteilung der wahre Wert der Population ist,sind Abweichungen ...
95% konfidenzintervallIntervall, das mit einerZuverl¨assigkeit von 95% der wahre Populationswertbeinhaltet. Typische Berechnung: Sch¨atzer ± Fehlertoleranz.Berechnung von Konfidenzintervallen mit anderenZuverl¨assigkeiten ...
Kritischer WertDie Anzahl Standardfehler links und rechtsvom Mittelwert der Stichproben-Verteilung, die mit demgewunschten Niveau an Sicherheit/Konfidenz ¨korrespondieren, meist 1.96 æ 95%.
FehlertoleranzenDer kritischer Wert multipliziert mit demStandardfehler. Von einem Konfidenzintervall, das Ausmaßdes Intervalls jeweils auf einer Seite von der gesch¨atztenStatistik. Kleine Fehlertoleranzen stammen ...
68-95-99,7 RegelDie Fl¨achen unter der Normal-Verteilungeine, zwei, bzw. drei Standardabweichungen nach links undrechts vom Mittelwert umfasen circa 68, 95 & 99,7 Prozentder Gesamtfl¨ache unter der Normalverteilung. ...
Hypothesentest einer fixen ErwartungWir testen, ob eineSch¨atzung basierend auf unserer Zufallsstichprobe signifikantvon einem fest erwarteten Populationsparameter abweicht.
Null Hypothese Ho:.Die Behauptung deren Plausilit¨at wir ineinem Hypothesentest ermitteln, ist die H0. Normalerweise istdie H0 eine Aussage, wie: Es gibt keine Unterschiede, keinenZusammenhang. Damit eine H0 testbar ist, ...
Alternativhypothese H1Beinhaltet was wir schlussfolgernsollten, wenn wir die H0 ablehnen.