In dieser Lektion befinden sich 29 Karteikarten
wichtige Begriffe
Diese Lektion wurde von RahelMauss erstellt.
- Modus / Modalwert der Wert einer Datenreihe, der am häufigsten vorkommt unempfindlich gegenüber Ausreißern
- Median zerlegt eine Datenreihe in 2 gleichgroße Teile unter-/oberhalb des Medians liegen immer 50% der Werte (n+1):2 unempfindlich gegenüber Ausreißern
- Mittelwert -> Daten werden aufsummiert, durch Anzahl der Datenpunkte geteilt -> Summe der quadrierten Abweichungen aller Werte vom Mittelwert ergibt ein Minimum (..?) -> wird durch Ausreißer beeinflusst!
- Histogramm zur graf. Darstellung von abs. + rel. Häufigkeitsverteilungen bei metr. Variablen mit vielen unterschiedl. Ausprägungen keine Zwischenräume zwischen den Balken! Wahl der Spaltenbreite entscheidend ...
- Nominalskala niedrigstes Skalenniveau / Informationsgehalt, lediglich: wie häufig? zB Geschlecht (männlich, weiblich), Familienstand (ledig, verheiratet, geschieden), Haarfarbe (braun, blond, andere) Abstand nicht ...
- Varianz mittlere quadrierte Abweichung vom Mittelwert -> schwer interpretierbar deswegen wird die Wurzel aus der Varianz berechnet (somit Quadrierung rückgängig gemacht) => Standardabweichung
- rechtsschief \ Mittelwert > Median > Modus
- linksschief / Mittelwert < Median < Modus
- 5-Punkte-Zusammenfassung Minimum Maximum Median unteres Quartil oberes Quartil
- Chi-Quadrat x² Zusammenhangsmaß immer größer oder gleich 0 0: beide Variablen sind unabhängig je größer x², desto größer der Unterschied nicht normiert, daher schwer interpretierbar
- Cramers V normiertes Zusammenhangsmaß besitzt alle wünschenswerten Eigenschaften für den Zusammenhang zweier nominalskalierter Variablen Wert 0 bei Unabhängigkeit Wert 1 bei perfekter Abhängigkeit
- Kontingenzkoeffizient K wie Cramers V ein Maß für den Zusammenhang nominalskalierter Variablen nicht so adäquat wie Cramers V, da Wert 1 nie erreicht wird -> Lösung: KORRIGIERTER KOEFFIZIENT K* kann bei quadratischen Tabellen ...
- Korrelation Werte von -1 bis 1 sind möglich wenn die Korrelation 1 ist, liegen die Werte auf einer steigenden Gerade: niedrigere Korrelation, eher Punktewolke die Korrelation ist unter zulässigen Transformationen ...
- diskret es gibt nix zwischen zwei Werten. Nur den einen und den anderen Wert. Beispiel: Anzahl von Personen
- stetig auch der Zwischenraum, zum Beispiel zwischen zwei ganzen Zahlen ist abzählbar. Beispiel: Längen-/Gewichtsangaben
- Zusammenhangsmaß für intervallskalierte Variablen ... Korrelationskoeffizient r (auch: Pearsonscher Korrelationskoeffizient / Produkt-Moment-Korrelation) Aussage über Zusammenhang zw. AV und UV, nicht über Kausalität normiert, also alle Werte im Intervall ...
- gegensinnig große Werte der einen Variablen gehen mit kleinen Werten der anderen Variablen einher
- gleichsinnig große Werte der einen Variablen gehen mit ebenfalls großen Werten der anderen Variablen einher
- Determinationskoeffizient r² -> erklärt den Anteil der durch die Regression erklärten Variation Werte zwischen 0 und 1 je höher r², umso stärker die Beziehung zwischen den betrachteten Variablen gibt den Anteil der Varianz ...
- Schwankungsbreite Standardschätzfehler SEE ODER Schätzfehlervarianz SE2 / MSE
- Prädiktor Vorhersage, also unabhängige Variable
- Kriterium abhängige Variable
- Was ist SSr? Summe der Abweichungsquadrate der vorhergesagten Werte zum Mittelwert --> das, was durch die Regressionsgerade an Variation an der AV aufgeklärt werden kann
- Was bedeutet SEE?? Standardschätzfehler! analog zur Standardabweichung -> gibt an wie groß die Schwankung um die durch die Regression vorhergesagten Werte ist
- Was ist eine Regression? Vorgehen, um die beste Gerade für bestimmte Daten zu finden, um dann zum Beispiel andere Werte vorherzusagen
- Wichtig für die empirische Verteilungsfunktion: Ordinalskalenniveau (also, damit sie sinnvoll interpretiert werden kann...)
- Korrelationskoeffizient = Produkt-Moment-Korrelation
- Leverage Hebelwirkung auf x-Achse
- y-Diskrepanz Wert fällt in y-Richtung aus der Reihe