M2_Statistik (Fach) / Übungen (Lektion)

In dieser Lektion befinden sich 33 Karteikarten

t

Diese Lektion wurde von vanillejoghurt erstellt.

Lektion lernen

Diese Lektion ist leider nicht zum lernen freigegeben.

  • Univariate Statistik Beschreibung einzelner Variablen 
  • Merkmal Merkmalsausprägung Merkmal - das, was untersucht wird (die Frage) Merkmalsausprägung - der Wert auf die konkrete Frage
  • 1.Absolute Häufigkeiten 2.Relative Häufigkeiten ... 1. Anzahl aller Merkmalsausprägungen einer Variable table(piraten$meer) 2. Gesamtzahl der Objekte relativierten Häufigkeiten prop.table(table(piraten$meer)) 3. prop.table(table(piraten$meer))*100 ...
  • Maße der zentralen Tendenz Modalwert: Merkmalsausprägung, die am häufigsten vorkommt which.max(table(piraten$meer)) Median: Dieser Wert ist derjenige, der in der Mitte der Verteilung liegt, für den also gilt, dass mindestens ...
  • Streuungsmaße Streubereich: range(piraten$alter, na.rm = T)  diff(range(piraten$alter, na.rm = T)) Quartile: quantile(piraten$schiffe, na.rm = T)  Interquartilsbereich: IQR(piraten$schiffe, na.rm=T) Perzentile: quantile(piraten$schiffe, ...
  • Unterschied Stichprobenvarianz Populationsvarianz Stichprobenvarianz: Quadratsumme durch n Populationsvarianz: Quadratsumme durch n-1 inR: Varianz: var(piraten$schiffe, na.rm = T)*(length(piraten$schiffe)-1)/length(piraten$schiffe) SD: sqrt(var(piraten$schiffe, ...
  • Boxplot mit ggplot boxplot_schiffe + geom_boxplot() + stat_boxplot(geom="errorbar", width=0.5) + labs(x="", y="Anzahl der versenkten Schiffe") + scale_y_continuous(breaks = seq(0,8,1))
  • Getrimmtes arithmetisches Mittel mean(piraten$schaetze, na.rm = T, trim=.02) berücksichtigt einen Prozentsatz der Werte oben und unten nicht
  • Median der absoluten Abweichungen vom Median Beträge der Abweichungen der Werte vom Median berechnet und vondiesen Beträgen der Median gebildet. mad(piraten$schaetze, na.rm = T)
  • R-Befehle 2 mal: Kennwerte für Subgruppen von Stichproben ... describeBy(piraten$gefahr, piraten$meer) by(piraten$gefahr, piraten$meer, mean, na.rm=T)
  • Zusammenhänge zwischen zwei intervallskalierten Variablen ... Produkt-Moment-Korrelation: Kovarianz (Anzahl der Messwertpaare geteilte Summe der Produkte der Differenzen der x- und y-Werte von ihrem jeweiligen Mittelwert) PMK: Kovarianz/Produkt der Standardabweichungen  ...
  • Lineare Regression Prädiktor: UV Kriterium: AV ... Kriteriumswerte auf der Grundlage der Prädiktorwerte möglichstgut vorhersagt. Diese Gerade wird als Regressionsgerade bezeichnet
  • Schätzung der Regressionsgeraden Kriterium der kleinsten Quadrate: Die Regressionsgerade wird so geschätzt, dass die Summe der quadrierten Abweichung dergeschätzten y-Werte ( ) von den tatsächlichen y-Werten möglichst klein ist. ...
  • Beziehung Korrelation Regressionskoeffizient b_yx = r_xy*(sd_y/sd_x)
  • Darstellung Regressionsgerade lm(piraten$schiffe ~ piraten$gefahr)
  • Erklärung R-Ausgabe bei lm-Befehl #### Call:## lm(formula = piraten$schiffe ~ piraten$gefahr)#### Coefficients:## (Intercept) piraten$gefahr## 0.9263 0.5132 Intercept: y-Achsenabschnitt a_yx Geradengleichung: Schiffe_y = 0.5132*Gefahr ...
  • Standardisierte Regressionskoeffiziente beta : Kovarianz/Standardabweichung_x^2 Standardisierung:  lm.beta(lm(piraten$schiffe ~ piraten$gefahr)) entspricht PMK
  • Güte der Vorhersage Determinationskoeffizient Zerlegung der Streuung des Kriteriums in de Residualvarianz (Streuung um die tatsächlichen y-Werte, Residuen) und die Regressionsvarianz (Streeung der vorhergesagten Werte um Mittelwert y, Kriterium) ...
  • Zusammenhänge zwischen zwei dichotomen Merkmalen Kreuztabelle: table(piraten$schwimmen, piraten$besitzer_in) CrossTable(piraten$schwimmen, piraten$besitzer_in, prop.chisq=F) Phi-Tabelle: phi(table(piraten$schwimmen, piraten$besitzer_in))
  • Zusammenhänge zwischen ordinalskalierten Variablen ... Rangkorrelationskoeffiziente. bei gleichen Werten: Rangbindung Kendalls Tau cor(piraten$gefahr, piraten$schiffe, method="kendall", use="pairwise.complete.obs") Spearmans Rho cor(piraten$gefahr, piraten$schiffe, ...
  • Konfidenzintervalle Grenzen: Mittelwert plusminus sd*t-Wert je größer stichprobe desto enger das intervall je größer konfidenzlevel desto breiter das intervall CI(piraten$schaetze) CI(piraten$schaetze[!is.na(piraten$schaetze)], ...
  • t-Test: Arten Prüfgröße unabhängige Stichproben: Vergleich zweier MW abhängige Stichproben: Vergleich zweier MW eine Stichprobe: Vergleich MW aus vorgegebenem Mittelwert Prüfgröße: MW_Differenz - (mü_x-mü_y [Abweichung ...
  • t-Test Obergrenze Bayes-Faktor Shannon-Information Bayes-Faktor: 1/(-exp(1)*0.00046*log(0.00046)) 1/(-exp(1)*t.test(piraten$gefahr ~ piraten$besitzer_in)$p.value*log(t.test(piraten$gefahr ~ piraten$besitzer_in)$p.value)) Shannon: -log2(t.test(piraten$gefahr ...
  • Gerichtete Hypothesen alternative = "greater" - 1. Gruppe hat größeren Mittelwert "less" - 1. Gruppe hat kleineren Mittelwert
  • ANOVA Voraussetzung Die abhängige Variable muss intervallskaliert sein (logisch, weil Mittelwerte miteinanderverglichen werden und die Interpretation von Mittelwerten erst ab Intervallskalenniveausinnvoll ist). Die Varianzen ...
  • ANOVA Prüfgröße F = geschätzte Varianz zwischen den Gruppen/geschätzte Varianz innerhalb der Gruppe
  • ANOVA: R-Befehl und Output summary(aov(piraten$gefahr ~ piraten$meer)) ##                   Df  Sum   Sq Mean Sq F  value Pr(>F)## piraten$meer 2 50.54   25.270 8.523 0.000437 ***## Residuals 81    240.16   2.965## ...
  • Inferenzstatistik der Regression und Korrelation t-Test ... Die korrelierten Merkmale müssen intervallskaliert sein.Die Merkmale müssen bivariat normalverteilt sein (s. Grafik bei Sedlmeier & Renkewitz,2018, S. 419). Die Nullhypothese lautet: Die Korrelation ...
  • z-Test Wenn man einen Korrelationskoeffizienten nicht gegen einen Korrelationskoeffizienten von 0 prüfenmöchte, sondern gegen einen anderen Korrelationskoeffizienten (also z. B. überprüfen möchte, obdie ...
  • t-Test Regressionskoeffizienten summary(lm(piraten$schiffe ~ piraten$gefahr))
  • F-Test für die Gesamtgüte des Regressionsmodells Abweichung der Regressionsgeraden vom Mittelwert des Kriteriums Regressionsquadratsumme. Abweichung der tatsächlichen Werte des Kriteriums von den vorhergesagten Werten Fehlerquadratsumme Gesamtquadratsumme ...
  • Chi-Quadrat-Test Voraussetzungen Der Chi-Quadrat-Test für zwei Variablen prüft, ob zwischen zwei nominalskalierten Variablen einZusammenhang besteht. Jede Untersuchungseinheit muss innerhalb der Variablen eindeutig einer bestimmtenMerkmalsausprägung ...
  • R-Befehl: Chi-Quadrat-Test chisq.test(table(piraten$besitzer_in, piraten$meer)) #### Pearson's Chi-squared test#### data: table(piraten$besitzer_in, piraten$meer)## X-squared = 27.145, df = 2, p-value = 1.275e-06 die Art des durchgeführten ...