Statistik (Fach) / Basismodul (Lektion)

In dieser Lektion befinden sich 115 Karteikarten

..

Diese Lektion wurde von SOWI erstellt.

Lektion lernen

  • Der Anteil der Varianz in y, die durch eine OLS Regression durch x aufgeklärt werden kann; ein Indikator also, wie gut das Modell zu den Daten passt.
  • Linearität OLS Regression schätzen die beste Gerade als Modell, das einen Zusammenhang beschreibt. Wenn der Zusammenhang aber nicht linear ist, ist die OLS Regression ein fragliches Modell.
  • Subgruppen Wenn die untersuchte Beziehung für Untergruppen unterschiedlich ausfällt, ist der allgemeine Zusammenhang über alle hinweg tendenziell verzerrt.
  • Extrapolation Vorhersagen in Bereiche, in denen es keine tatsächlich beobachteten Fälle gibt.
  • Dummy Variable Eine kategoriale Prädikatorvariable mit den zwei Ausprägungen 0 (Referenzgruppe) und 1. Mittels Dummy Variablen lassen sich Durchschnittsunterschiede schätzen.
  • Regression zur Mitte Weil Korrelationen de Facto immer kleiner sind als 1, tendiert jeder vorhergesagte Wert ˆy dazu, weniger Standardabweichungen von seinem Mittelwert ¯y entfernt zu liegen, als das dazugehörige x von ...
  • Kausale versus deskriptive Interpretation der OLS ... Regression berechnen Steigungen, d.h. die Zunahme von y,wenn x um eine Einheit steigt. Dennoch sollten wir uns huten, ¨die Steigungen kausal zu interpretieren. Stattdessen sollte dieRegression als ein ...
  • Scheinkorrelation Wenn eine Drittvariable sowohl mit der abhängigen Variable y, als auch dem interessierenden Prädiktor x korreliert, verzerrt sie die Stärke des Zusammenhangs y, x.
  • Konfundierende Variablen Verzerren Zusammenhang x, y, bzw. verursachen Scheinkorrelationen. Sollten als Drittvariable konstant gehalten werden.
  •  Frisch-Waugh-Lovell Theorem:  Die multiple OLS Regression kommt zum gleichen Ergebnisse, als wurde man in mehreren Schritten zunächst die Einflusse aller Drittvariablen auf die abhängige Variable y und den Prädiktor von Interesse ...
  • Multiple OLS Regression Eine OLS Regression mit mehreren k Prädiktoren, die die Summe der quadrierten Residuen minimieren.
  • Drittvariablen Kontrolle Was eine multiple OLS Regression bei der Drittvariablen-Kontrolle technisch macht, kann durch drei Perspektiven gut nachvollzogen werden: a) das Frisch-Waugh-Lovell Theorem, b) die paratial Ableitung ...
  • Mediirende Variable / Mediator  Mediierende Variable/Mediator: “Vermitteln”/Erklären als Mechanismen Zusammenhang x, y. Konstanthaltung als Drittvariable verzerrt Zusammenhang x, y.
  • Mulitkolinearität Multicollinearität: Wenn einer oder mehrere der Prädiktoren selbst sehr gut (R2 > 0.9) durch manche oder mehrere der anderen Prädiktoren vorhergesagt werden können. Konsequenz sind unverlässliche ...
  • Adjustieres R² Adjusted R2: Kennzahl die ausdruckt wie viel der Varianz einer abhängigen Variable eine multiple OLS Regression aufklärt. Im Gegensatz zum normalen R2, wird die Kennzahl jedoch für die Anzahl der Prädiktoren ...
  • Zufall Ergebnis ist nicht vorhersagbar, hat aber angebbareWahrscheinlichkeiten.
  • Population / Grundgesamtheit Die Gesamtgruppe vonPersonen oder Einheiten uber die wir etwas lernen wollen.
  • (Zufalls-) Stichprobe Ein (zuf¨allig gezogener) Ausschnitt einerPopulation.
  • Experiment Zuf¨allige Zuweisung (Randomisierung) zuExperimentalgruppen mit anschließender Intervention undKontrolle.
  • Repräsentativ Wenn die Sch¨atzer die Populationsparameterakkurat reflektieren. Wird auch “extern valide” genannt.
  • Verzerrt Wenn Stichproben systematisch unrepr¨asentativ sind(nicht extern valide), oder wenn kausale E!ekte aufGrundlage systematisch ungleicher Gruppen gesch¨atzt werden(nicht intern valide).
  • Zufallsstichprobem-Variabilität Naturliche Tendenz von ¨Zufallsstichproben sich jeweils in zuf¨alliger Hinsicht voneinander zu unterscheiden und zuf¨allig von derRepr¨asentativit¨at abzuweichen
  • Populationsparameter Ein numerisches Attribut einer(Gesamt-)Population, z.B. das durchschnittliche Alter inDeutschland; ist und bleibt meist unbekannt.
  • Statistik /Schätzer Aus Zufallsstichproben gesch¨atzter Wertfur einen Populationsparameter
  • Zufallsvariable Wenn die Werte einer Variable das Ergebniseines Zufallsvorgangs sind.
  • Erwartungswert E(x) Der theoretisch-langfristige (beiunendlichen Wiederholungen) Mittelwert einer Zufallsvariable.Der Erwartungswert ist der wahre Mittelwert in einerPopulation: E(x) = µ.
  • Wahrscheinlichkeitsverteilung Verteilung einer Zufallsvariable.Die Fl¨ache unter der Wahrschienlichkeitsverteilung gibt dieWahrscheinlichkeit an und ist insgesamt immer 1.
  • Law of large numbers Die relative H¨aufigkeit einesEreignisses n¨ahert sich der wahren Wahrscheinlichkeit desEreignisses an, je mehr unabh¨angige Runden/Ziehungendurchgefuhrt werden
  • Wahrscheinlichkeit Die Wahrscheinlichkeit eines Ereignissesist seine langfristige (æ Œ) relative H¨aufigkeit.
  • Stichprobenverteilung Zeigt die Verteilung einerStatistik/eines Sch¨atzers uber alle denkbaren ¨Zufallsstichproben.
  • Central Limit Theorem Die Stichproben-Verteilung vonMittelwerten (& relativen h¨aufigkeiten, —, ...) n¨ahert sichder Normal-Verteilung, je gr¨oßer die Zufallsstichprobe, egalwie die eigentliche Variable verteilt ist, ...
  • Normalverteilung Eine nutzliche, symmetrische ¨Wahrscheinlichkeitsfunktion die durch ihren Mittelwert undihre Standardabweichung definiert ist.
  • Standardfehler Die Standardabweichung derStichproben-Verteilung gesch¨atzt auf Bais einer konkretenZufallsstichprobe. Weil der Mittelwert derStichproben-Verteilung der wahre Wert der Population ist,sind Abweichungen ...
  • 95% Konfidenzintervall Intervall, das mit einerZuverl¨assigkeit von 95% der wahre Populationswertbeinhaltet. Typische Berechnung: Sch¨atzer ± Fehlertoleranz.Berechnung von Konfidenzintervallen mit anderenZuverl¨assigkeiten ...
  • Kritischer Wert Die Anzahl Standardfehler links und rechtsvom Mittelwert der Stichproben-Verteilung, die mit demgewunschten Niveau an Sicherheit/Konfidenz ¨korrespondieren, meist 1.96 → 95%.
  • Fehlertoleranz Der kritischer Wert multipliziert mit demStandardfehler. Von einem Konfidenzintervall, das Ausmaßdes Intervalls jeweils auf einer Seite von der gesch¨atztenStatistik. Kleine Fehlertoleranzen stammen ...
  • 68, 95, 99,7-Regel Die Fl¨achen unter der Normal-Verteilungeine, zwei, bzw. drei Standardabweichungen nach links undrechts vom Mittelwert umfasen circa 68, 95 & 99,7 Prozentder Gesamtfl¨ache unter der Normalverteilung. ...
  • Stichproben- Verteilung Zeigt die Verteilung einerStatistik/eines Sch¨atzers uber alle denkbaren ¨Zufallsstichproben.
  • Central Limit Theorem Die Stichproben-Verteilung vonMittelwerten (& relativen h¨aufigkeiten, —, ...) n¨ahert sichder Normal-Verteilung, je gr¨oßer die Zufallsstichprobe, egalwie die eigentliche Variable verteilt ist, ...
  • Normalverteilung Eine nutzliche, symmetrische ¨Wahrscheinlichkeitsfunktion die durch ihren Mittelwert undihre Standardabweichung definiert ist.
  • Standardfehler Die Standardabweichung derStichproben-Verteilung gesch¨atzt auf Bais einer konkretenZufallsstichprobe. Weil der Mittelwert derStichproben-Verteilung der wahre Wert der Population ist,sind Abweichungen ...
  • 95% konfidenzintervall Intervall, das mit einerZuverl¨assigkeit von 95% der wahre Populationswertbeinhaltet. Typische Berechnung: Sch¨atzer ± Fehlertoleranz.Berechnung von Konfidenzintervallen mit anderenZuverl¨assigkeiten ...
  • Kritischer Wert Die Anzahl Standardfehler links und rechtsvom Mittelwert der Stichproben-Verteilung, die mit demgewunschten Niveau an Sicherheit/Konfidenz ¨korrespondieren, meist 1.96 æ 95%.
  • Fehlertoleranzen Der kritischer Wert multipliziert mit demStandardfehler. Von einem Konfidenzintervall, das Ausmaßdes Intervalls jeweils auf einer Seite von der gesch¨atztenStatistik. Kleine Fehlertoleranzen stammen ...
  • 68-95-99,7 Regel Die Fl¨achen unter der Normal-Verteilungeine, zwei, bzw. drei Standardabweichungen nach links undrechts vom Mittelwert umfasen circa 68, 95 & 99,7 Prozentder Gesamtfl¨ache unter der Normalverteilung. ...
  • Hypothesentest einer fixen Erwartung Wir testen, ob eineSch¨atzung basierend auf unserer Zufallsstichprobe signifikantvon einem fest erwarteten Populationsparameter abweicht.
  • Hypothesentest eines relativen Vergleichs Wir testen, ob dieDi!erenz zwischen Gruppen signifikant gr¨oßer als 0 ist.
  • Hypothesentest eines Zusammenhangs Wir testen, ob einZusammenhang signifikant gr¨oßer als 0 ist.
  • Null Hypothese Ho: .Die Behauptung deren Plausilit¨at wir ineinem Hypothesentest ermitteln, ist die H0. Normalerweise istdie H0 eine Aussage, wie: Es gibt keine Unterschiede, keinenZusammenhang. Damit eine H0 testbar ist, ...
  • Alternativhypothese H1 Beinhaltet was wir schlussfolgernsollten, wenn wir die H0 ablehnen.