Statistik (Subject) / Übung (Lesson)

There are 81 cards in this lesson

Slides

This lesson was created by Abison_Cruso.

Learn lesson

  • Vorzeichentest, Ziel, Vorraussetzung? Syntax? Syntax wie bei Mann-Whytney-Test +: wilcox.test(x,y,paired=T) Ziel: Überprüfung ob sich die Mediane zweier verbundender Stichproben signifikant Unterscheiden > Verbunden Stichproben, zumindes Ordinalskaliert, keine Normalverteilung von nöten
  • Ziel F.Test? Syntax? Vorraussetzungen? Überprüfung ob sich die Vraianzen zweir Stichproben signifikant unterscheiden . Voraussetzung: Kardinalskaliert, Normalverteilt var.test(x,y,ratio=1,conf.level=0.95)
  • Ratio von Varianzen? Var1/Var2
  • apply, bedeutung, syntax? apply(x, 1|2(1=alle Reihen, 2= alle Spalten), sum|mean|Funktionen) bezieht sich immer auf den gesamten Ausschnitt, entweder Reihen1 oder Spalten2
  • Wie gebe ich in R Matrix Multiplikationen ein? %*%
  • Kovarianz? Erfasst die gemeinsame Variabilität von x und y 1/n [Summe] (xi-xquer)(yi-yquer)
  • Pearson-Korrelationskoeffizient Ist die Kovarianz von x und y skaliert auf einen Wertebereich von-1 bis 1 >> dimensionslos
  • Spearman-Rangkorrelationskoeffizient? enspricht Pearson-Korrelationskoeffizient angewand auf nach größe gereihte Variablen Vorsicht bei Bindungen (ties) dann keine lineare Funktion möglich
  • Interpretation von Korrelation? Korrelation ist nicht Kausalität Probleme: Scheinkorrelation aufgrund ähnlich gerichtetem Trend 1 > absolute Übereinstimmung 0-0.2 sehr schwache 0,2-0,4 schwache, 0,4-0,6 mittlere, 0,6-0,8 starke, 0,8-1 sehr starke
  • Drei Annahmen bei der linearen Regression? 1.f(x) ist eine lineare Funktion von x mit f(x)=beta+beta1*x 2. Y besteht aus f(x)(linearen Funktion) und einem Fehler Y=beta0+beta1*x+f 3. Die Fehler f sind unabhängig und normalverteilt mit Mittelwert 0 und Varianz (konstant)
  • Residuen-Analyse, lineare Regression, 4 Plots? namen bedeutung? Residual vs Fitted>> Sind Residuen unabhängig? >> je geradliniger desto unabhängiger Normal qq >> Sind Residuen normalverteilt ? >>Normalverteilung bei Übereinstimmung mit Linie Scale-Location>> Ist die Varianz der Residuen konstant? >>geradliniger konstanter (Homoskedastizität, Heteroskedastizität) Residuel vs Leverage>> Sind Ausreißer vorhanden wenn ja welcher Art und stärke Einfluss >> Innerhalb der CooksDistance vertretbar, je weiter entfernt desto einflussreicher, influence.measures(lm)
  • Bestimmtheitsmaß Lineare Regression? R²= (Var(ydachl)/(Var(y))
  • influence.measures? Untersuchung für jeden Punkt, die Auswirkungen auf verschiede Modellparameter wenn man diesen Punkt weglässt.
  • Was ist Ziel einer linearen Regression? Untersuchung von Abhängigkeiten
  • Welcher befehl dient um herauszufinden ob ein Vektor v den Wert True enthält? any(v)
  • Welche Parameter definieren die Regressionsgerade? Ordinatenabstand und Steigung
  • Durch das Quadrieren der Residuen werden bei der linearen Regression? Größere stärker gewichtet
  • Mit welcher Option der Funktion predict() kann der Vertrauensbereich definiert werden? Interval [= confidence]
  • Was bedeutet RMSE? Root mean square error
  • Richtwert für Einflussreiche Außereißer in plot(lm) erkennen y und x Richtung? X-Wert 4/n Y-Wert 2, -2
  • Varianzanalyse (ANOVA) Verfahren zur Untersuchung der Wirkung einer oder mehrere unabhängige Variablen auf eine oder mehrere abhängige Variablen  >> geht wie Regression von gerichtetem Zusammenhang aus >> die erklärende Variable darf Nominalskaliert sein !
  • Unabhängige Variablen = ? (Varianzanalyse) ... die einzelnen Ausprägungen dieser? Faktoren einzelnen Ausprägungen dieser sind Faktorenstufen
  • Ziel der Varianzanalyse? Test ob sich Faktoren (unabhängige Variablen) einzeln oder in kombination voneinander unterscheiden Vergleicht Mittelwerte anhand der Varianzen
  • einfaktorielle Varianzanalyse >abhängige Variable wird durch einen Faktor erklärt >> Frage: bestizt der erklärende Faktor einen Signifikanten Niveauunterschied (Mittelwert) in den verschiedenen Faktorstufen (Gruppen) >>> dafür folgender Vergleich: Varianz innerhalb der Gruppe                                                    Varianz zwischen den Gruppen >>>> F-Test
  • Varianzanalyse, Varianz innerhalb einer Gruppe, Varianz zwischen den Gruppen >> Schlussfolgerung auf Signifikanz ? → Ist die Varianz zwischen den Gruppen relativ groß im Vergleich zu derVarianz innerhalb der Gruppen so spricht das dafür dass die Mittelwerteder Gruppen unterschiedlich sind
  • Annahmen für ANOVA? Normalverteilung Homogenität der Varianzen (bartlett.test) >> unabhängigkeit der Fehler Von Vorteil >> Balanced Data .. gleiche Gruppengrößen!
  • Tests auf die homogenität von Varianzen? bartlett.test(x,g) >> p-Wert fligner.test leveneTest
  • Mit dem bartlett.test() überprüft man folgende Nullhypothese: Homogenität der Varianzen
  • Der Kruskal‐Wallis Test ist die parameterfreie Version der? Varianzanalyse
  • Die Nullhypothese der Varianzanalyse lautet? ☐ es gibt keinen signifikanten Unterschied bei den Mittelwerten der Gruppen
  • Der TukeyHSD() post‐hoc Test benötigt als input? aov()