Basismodul - Statistik online lernen

Statistik (Fach) / Basismodul (Lektion)

In dieser Lektion befinden sich 115 Karteikarten

Diese Lektion wurde von SOWI erstellt.

Lektion lernen

R² Der Anteil der Varianz in y, die durch eine OLS Regression durch x aufgeklärt werden kann; ein Indikator also, wie gut das Modell zu den Daten passt.
Linearität OLS Regression schätzen die beste Gerade als Modell, das einen Zusammenhang beschreibt. Wenn der Zusammenhang aber nicht linear ist, ist die OLS Regression ein fragliches Modell.
Subgruppen Wenn die untersuchte Beziehung für Untergruppen unterschiedlich ausfällt, ist der allgemeine Zusammenhang über alle hinweg tendenziell verzerrt.
Extrapolation Vorhersagen in Bereiche, in denen es keine tatsächlich beobachteten Fälle gibt.
Dummy Variable Eine kategoriale Prädikatorvariable mit den zwei Ausprägungen 0 (Referenzgruppe) und 1. Mittels Dummy Variablen lassen sich Durchschnittsunterschiede schätzen.
Regression zur Mitte Weil Korrelationen de Facto immer kleiner sind als 1, tendiert jeder vorhergesagte Wert ˆy dazu, weniger Standardabweichungen von seinem Mittelwert ¯y entfernt zu liegen, als das dazugehörige x von ...
Kausale versus deskriptive Interpretation der OLS ... Regression berechnen Steigungen, d.h. die Zunahme von y,wenn x um eine Einheit steigt. Dennoch sollten wir uns huten, ¨die Steigungen kausal zu interpretieren. Stattdessen sollte dieRegression als ein ...
Scheinkorrelation Wenn eine Drittvariable sowohl mit der abhängigen Variable y, als auch dem interessierenden Prädiktor x korreliert, verzerrt sie die Stärke des Zusammenhangs y, x.
Konfundierende Variablen Verzerren Zusammenhang x, y, bzw. verursachen Scheinkorrelationen. Sollten als Drittvariable konstant gehalten werden.
 Frisch-Waugh-Lovell Theorem: Die multiple OLS Regression kommt zum gleichen Ergebnisse, als wurde man in mehreren Schritten zunächst die Einflusse aller Drittvariablen auf die abhängige Variable y und den Prädiktor von Interesse ...
Multiple OLS Regression Eine OLS Regression mit mehreren k Prädiktoren, die die Summe der quadrierten Residuen minimieren.
Drittvariablen Kontrolle Was eine multiple OLS Regression bei der Drittvariablen-Kontrolle technisch macht, kann durch drei Perspektiven gut nachvollzogen werden: a) das Frisch-Waugh-Lovell Theorem, b) die paratial Ableitung ...
Mediirende Variable / Mediator  Mediierende Variable/Mediator: “Vermitteln”/Erklären als Mechanismen Zusammenhang x, y. Konstanthaltung als Drittvariable verzerrt Zusammenhang x, y.
Mulitkolinearität Multicollinearität: Wenn einer oder mehrere der Prädiktoren selbst sehr gut (R2 > 0.9) durch manche oder mehrere der anderen Prädiktoren vorhergesagt werden können. Konsequenz sind unverlässliche ...
Adjustieres R² Adjusted R2: Kennzahl die ausdruckt wie viel der Varianz einer abhängigen Variable eine multiple OLS Regression aufklärt. Im Gegensatz zum normalen R2, wird die Kennzahl jedoch für die Anzahl der Prädiktoren ...
Zufall Ergebnis ist nicht vorhersagbar, hat aber angebbareWahrscheinlichkeiten.
Population / Grundgesamtheit Die Gesamtgruppe vonPersonen oder Einheiten uber die wir etwas lernen wollen.
(Zufalls-) Stichprobe Ein (zuf¨allig gezogener) Ausschnitt einerPopulation.
Experiment Zuf¨allige Zuweisung (Randomisierung) zuExperimentalgruppen mit anschließender Intervention undKontrolle.
Repräsentativ Wenn die Sch¨atzer die Populationsparameterakkurat reflektieren. Wird auch “extern valide” genannt.
Verzerrt Wenn Stichproben systematisch unrepr¨asentativ sind(nicht extern valide), oder wenn kausale E!ekte aufGrundlage systematisch ungleicher Gruppen gesch¨atzt werden(nicht intern valide).
Zufallsstichprobem-Variabilität Naturliche Tendenz von ¨Zufallsstichproben sich jeweils in zuf¨alliger Hinsicht voneinander zu unterscheiden und zuf¨allig von derRepr¨asentativit¨at abzuweichen
Populationsparameter Ein numerisches Attribut einer(Gesamt-)Population, z.B. das durchschnittliche Alter inDeutschland; ist und bleibt meist unbekannt.
Statistik /Schätzer Aus Zufallsstichproben gesch¨atzter Wertfur einen Populationsparameter
Zufallsvariable Wenn die Werte einer Variable das Ergebniseines Zufallsvorgangs sind.
Erwartungswert E(x) Der theoretisch-langfristige (beiunendlichen Wiederholungen) Mittelwert einer Zufallsvariable.Der Erwartungswert ist der wahre Mittelwert in einerPopulation: E(x) = µ.
Wahrscheinlichkeitsverteilung Verteilung einer Zufallsvariable.Die Fl¨ache unter der Wahrschienlichkeitsverteilung gibt dieWahrscheinlichkeit an und ist insgesamt immer 1.
Law of large numbers Die relative H¨aufigkeit einesEreignisses n¨ahert sich der wahren Wahrscheinlichkeit desEreignisses an, je mehr unabh¨angige Runden/Ziehungendurchgefuhrt werden
Wahrscheinlichkeit Die Wahrscheinlichkeit eines Ereignissesist seine langfristige (æ Œ) relative H¨aufigkeit.
Stichprobenverteilung Zeigt die Verteilung einerStatistik/eines Sch¨atzers uber alle denkbaren ¨Zufallsstichproben.
Central Limit Theorem Die Stichproben-Verteilung vonMittelwerten (& relativen h¨aufigkeiten, —, ...) n¨ahert sichder Normal-Verteilung, je gr¨oßer die Zufallsstichprobe, egalwie die eigentliche Variable verteilt ist, ...
Normalverteilung Eine nutzliche, symmetrische ¨Wahrscheinlichkeitsfunktion die durch ihren Mittelwert undihre Standardabweichung definiert ist.
Standardfehler Die Standardabweichung derStichproben-Verteilung gesch¨atzt auf Bais einer konkretenZufallsstichprobe. Weil der Mittelwert derStichproben-Verteilung der wahre Wert der Population ist,sind Abweichungen ...
95% Konfidenzintervall Intervall, das mit einerZuverl¨assigkeit von 95% der wahre Populationswertbeinhaltet. Typische Berechnung: Sch¨atzer ± Fehlertoleranz.Berechnung von Konfidenzintervallen mit anderenZuverl¨assigkeiten ...
Kritischer Wert Die Anzahl Standardfehler links und rechtsvom Mittelwert der Stichproben-Verteilung, die mit demgewunschten Niveau an Sicherheit/Konfidenz ¨korrespondieren, meist 1.96 → 95%.
Fehlertoleranz Der kritischer Wert multipliziert mit demStandardfehler. Von einem Konfidenzintervall, das Ausmaßdes Intervalls jeweils auf einer Seite von der gesch¨atztenStatistik. Kleine Fehlertoleranzen stammen ...
68, 95, 99,7-Regel Die Fl¨achen unter der Normal-Verteilungeine, zwei, bzw. drei Standardabweichungen nach links undrechts vom Mittelwert umfasen circa 68, 95 & 99,7 Prozentder Gesamtfl¨ache unter der Normalverteilung. ...
Stichproben- Verteilung Zeigt die Verteilung einerStatistik/eines Sch¨atzers uber alle denkbaren ¨Zufallsstichproben.
Central Limit Theorem Die Stichproben-Verteilung vonMittelwerten (& relativen h¨aufigkeiten, —, ...) n¨ahert sichder Normal-Verteilung, je gr¨oßer die Zufallsstichprobe, egalwie die eigentliche Variable verteilt ist, ...
Normalverteilung Eine nutzliche, symmetrische ¨Wahrscheinlichkeitsfunktion die durch ihren Mittelwert undihre Standardabweichung definiert ist.
Standardfehler Die Standardabweichung derStichproben-Verteilung gesch¨atzt auf Bais einer konkretenZufallsstichprobe. Weil der Mittelwert derStichproben-Verteilung der wahre Wert der Population ist,sind Abweichungen ...
95% konfidenzintervall Intervall, das mit einerZuverl¨assigkeit von 95% der wahre Populationswertbeinhaltet. Typische Berechnung: Sch¨atzer ± Fehlertoleranz.Berechnung von Konfidenzintervallen mit anderenZuverl¨assigkeiten ...
Kritischer Wert Die Anzahl Standardfehler links und rechtsvom Mittelwert der Stichproben-Verteilung, die mit demgewunschten Niveau an Sicherheit/Konfidenz ¨korrespondieren, meist 1.96 æ 95%.
Fehlertoleranzen Der kritischer Wert multipliziert mit demStandardfehler. Von einem Konfidenzintervall, das Ausmaßdes Intervalls jeweils auf einer Seite von der gesch¨atztenStatistik. Kleine Fehlertoleranzen stammen ...
68-95-99,7 Regel Die Fl¨achen unter der Normal-Verteilungeine, zwei, bzw. drei Standardabweichungen nach links undrechts vom Mittelwert umfasen circa 68, 95 & 99,7 Prozentder Gesamtfl¨ache unter der Normalverteilung. ...
Hypothesentest einer fixen Erwartung Wir testen, ob eineSch¨atzung basierend auf unserer Zufallsstichprobe signifikantvon einem fest erwarteten Populationsparameter abweicht.
Hypothesentest eines relativen Vergleichs Wir testen, ob dieDi!erenz zwischen Gruppen signifikant gr¨oßer als 0 ist.
Hypothesentest eines Zusammenhangs Wir testen, ob einZusammenhang signifikant gr¨oßer als 0 ist.
Null Hypothese Ho: .Die Behauptung deren Plausilit¨at wir ineinem Hypothesentest ermitteln, ist die H0. Normalerweise istdie H0 eine Aussage, wie: Es gibt keine Unterschiede, keinenZusammenhang. Damit eine H0 testbar ist, ...
Alternativhypothese H1 Beinhaltet was wir schlussfolgernsollten, wenn wir die H0 ablehnen.

Karteikarten online lernen - wann und wo du willst!

Statistik (Fach) / Basismodul (Lektion)