Vorzeichentest, Ziel, Vorraussetzung? Syntax?
Syntax wie bei Mann-Whytney-Test +: wilcox.test(x,y,paired=T) Ziel: Überprüfung ob sich die Mediane zweier verbundender Stichproben signifikant Unterscheiden > Verbunden Stichproben, zumindes Ordinalskaliert, keine Normalverteilung von nöten
Ziel F.Test? Syntax? Vorraussetzungen?
Überprüfung ob sich die Vraianzen zweir Stichproben signifikant unterscheiden . Voraussetzung: Kardinalskaliert, Normalverteilt var.test(x,y,ratio=1,conf.level=0.95)
Ratio von Varianzen?
Var1/Var2
apply, bedeutung, syntax?
apply(x, 1|2(1=alle Reihen, 2= alle Spalten), sum|mean|Funktionen) bezieht sich immer auf den gesamten Ausschnitt, entweder Reihen1 oder Spalten2
Wie gebe ich in R Matrix Multiplikationen ein?
%*%
Kovarianz?
Erfasst die gemeinsame Variabilität von x und y 1/n [Summe] (xi-xquer)(yi-yquer)
Pearson-Korrelationskoeffizient
Ist die Kovarianz von x und y skaliert auf einen Wertebereich von-1 bis 1 >> dimensionslos
Spearman-Rangkorrelationskoeffizient?
enspricht Pearson-Korrelationskoeffizient angewand auf nach größe gereihte Variablen Vorsicht bei Bindungen (ties) dann keine lineare Funktion möglich
Interpretation von Korrelation?
Korrelation ist nicht Kausalität Probleme: Scheinkorrelation aufgrund ähnlich gerichtetem Trend 1 > absolute Übereinstimmung 0-0.2 sehr schwache 0,2-0,4 schwache, 0,4-0,6 mittlere, 0,6-0,8 starke, 0,8-1 sehr starke
Drei Annahmen bei der linearen Regression?
1.f(x) ist eine lineare Funktion von x mit f(x)=beta+beta1*x 2. Y besteht aus f(x)(linearen Funktion) und einem Fehler Y=beta0+beta1*x+f 3. Die Fehler f sind unabhängig und normalverteilt mit Mittelwert 0 und Varianz (konstant)
Residuen-Analyse, lineare Regression, 4 Plots? namen bedeutung?
Residual vs Fitted>> Sind Residuen unabhängig? >> je geradliniger desto unabhängiger Normal qq >> Sind Residuen normalverteilt ? >>Normalverteilung bei Übereinstimmung mit Linie Scale-Location>> Ist die Varianz der Residuen konstant? >>geradliniger konstanter (Homoskedastizität, Heteroskedastizität) Residuel vs Leverage>> Sind Ausreißer vorhanden wenn ja welcher Art und stärke Einfluss >> Innerhalb der CooksDistance vertretbar, je weiter entfernt desto einflussreicher, influence.measures(lm)
influence.measures?
Untersuchung für jeden Punkt, die Auswirkungen auf verschiede Modellparameter wenn man diesen Punkt weglässt.
Was ist Ziel einer linearen Regression?
Untersuchung von Abhängigkeiten
Welcher befehl dient um herauszufinden ob ein Vektor v den Wert True enthält?
any(v)
Welche Parameter definieren die Regressionsgerade?
Ordinatenabstand und Steigung
Durch das Quadrieren der Residuen werden bei der linearen Regression?
Größere stärker gewichtet
Mit welcher Option der Funktion predict() kann der Vertrauensbereich definiert werden?
Interval [= confidence]
Was bedeutet RMSE?
Root mean square error
Richtwert für Einflussreiche Außereißer in plot(lm) erkennen y und x Richtung?
X-Wert 4/n Y-Wert 2, -2
Varianzanalyse (ANOVA)
Verfahren zur Untersuchung der Wirkung einer oder mehrere unabhängige Variablen auf eine oder mehrere abhängige Variablen >> geht wie Regression von gerichtetem Zusammenhang aus >> die erklärende Variable darf Nominalskaliert sein !
Unabhängige Variablen = ? (Varianzanalyse)
...
die einzelnen Ausprägungen dieser?
Faktoren einzelnen Ausprägungen dieser sind Faktorenstufen
Ziel der Varianzanalyse?
Test ob sich Faktoren (unabhängige Variablen) einzeln oder in kombination voneinander unterscheiden Vergleicht Mittelwerte anhand der Varianzen
einfaktorielle Varianzanalyse
>abhängige Variable wird durch einen Faktor erklärt >> Frage: bestizt der erklärende Faktor einen Signifikanten Niveauunterschied (Mittelwert) in den verschiedenen Faktorstufen (Gruppen) >>> dafür folgender Vergleich: Varianz innerhalb der Gruppe Varianz zwischen den Gruppen >>>> F-Test
Varianzanalyse, Varianz innerhalb einer Gruppe, Varianz zwischen den Gruppen >> Schlussfolgerung auf Signifikanz ?
→ Ist die Varianz zwischen den Gruppen relativ groß im Vergleich zu derVarianz innerhalb der Gruppen so spricht das dafür dass die Mittelwerteder Gruppen unterschiedlich sind
Annahmen für ANOVA?
Normalverteilung Homogenität der Varianzen (bartlett.test) >> unabhängigkeit der Fehler Von Vorteil >> Balanced Data .. gleiche Gruppengrößen!
Tests auf die homogenität von Varianzen?
bartlett.test(x,g) >> p-Wert fligner.test leveneTest
Mit dem bartlett.test() überprüft man folgende Nullhypothese:
Homogenität der Varianzen
Der Kruskal‐Wallis Test ist die parameterfreie Version der?
Varianzanalyse
Die Nullhypothese der Varianzanalyse lautet?
☐ es gibt keinen signifikanten Unterschied bei den Mittelwerten der Gruppen
Der TukeyHSD() post‐hoc Test benötigt als input?
aov()