Methoden Datenanalyse (Subject) / Methoden (Lesson)

There are 90 cards in this lesson

Methoden Datenanlayse

This lesson was created by elmanito.

Learn lesson

  • Interpretation t-Test, wann H0 verwerfen? wenn geschätzer t-Wert > t* dann H0 verwerfen, es GIBT einen sign. MW Unterschied zwischen den beiden Gruppen (ZB Bildung HAT Einfluss auf Religiosität) wenn geschätzer Wert kleiner ist wird Nullhypothese behalten, es gibt KEINEN sign. MW unterschied (bildung hat keinen Einfluss auf Religiosität)
  • Vorraussetzungen des t-Test unabhängige Stichproben betrachtete Variable muss mind. intervallskaliert sein Einzelbeobachtungen müssen in beiden Stichproben normalverteilt sein Varianzhomogenität
  • Quasi-experimentelles Design / probleme nicht vergleichbarkeit der Gruppen (selbstselektion) systematischer Ausfall von Probanden Regressionseffekt eingeschränkte kontrollmöglichkeiten von Drittvariableneffekte Designs: Vorher Nachher Design + Kontrollgruppe Zeitreihendesign
  • Wozu dienen Effektstärken? für eine bessere Beurteilbarkeit/Vergleichbarkeit für die Stichprobenplanung (im vorraus) für die Ermittlung der Teststärke (im nachhinein)
  • Vorraussetzungen der linearen Regression lineare Zsmhänge zwischen den Variablen keine Interaktionseffekte keine Autokorrelation Normalverteilung der Residuen vollständig spezifizierte Modelle (also alle relevanten Erklärungsgrößen sind gegeben)
  • Arten von Drittvariablen Antezedierende Drittvariable: vorausgehende Drittvariable, jeweils ein Pfeil von z zu x und zu y. Hier liegt sogenannte SCHEINKORRELATION vor intervenierende Drittvariable: dazwischentretende Drittvariable,  x --> z --->y. Bei Geschlecht ist die Drittvariable eigentlich IMMER intervenierend. Hier liegt die sogenannte MEDIATION vor Multivariate Drittvariable (2) : zwischen x und y führt jeweils noch ein Pfeil siehe Grafik Ordner
  • Adäquatheitsbedingung: Folgerungsbedingung der Schluss vom Explanans auf Explanandum muss formal korrekt sein
  • Definition Indifferenztabelle und Kontingenztabelle Kontingenztabelle: zur gemeinsamen Analyse zweier Kategorialen Merkmale. Dargestellt werden die absoluten Häufigkeiten und die Randhäufigkeiten. Indifferenztabelle: wird aus den eindimensionalen Randverteilungen ermittelt und die die Tabelle der erwarteten Häufigkeiten
  • Adäquatsheitsbedingung 3 : Signifikanzbedingung/empirischen Gehalt Problem Explanans muss empirisch Gehalt haben. also empirisch beobachtbar sein. Korrespondenzproblem, Hypothesen haben manchmal keinen direkten empirischen Bezug (zB Zufriedenheit, Motivation..) Lösung: Operationalismus (Hypothesen durch Messmethode definieren: Intelligenz ist, was Messverfahren misst) Bilaterale Reduktionssätze (Wenn Person einem Stimulus ausgesetzt wird, dann wird ihr das Prädikat A zugeschrieben wenn sie Reaktion R äußert wird ihr "nicht A" zugeschrieben.
  • Welche Bedingungen liegen beim t-Test vor? also df und a df= 8 a= 0,05
  • Was untersicht der tTest er untersucht, ob sich die Mittelwerte zweier Gruppen systematisch unterscheiden
  • Interpretation Chi^2 Chi^2  > chi^2* : HO wird verworfen
  • Stichprobe kleinere Menge die größere Menge respräsentiert
  • Externe Validität Externe Validität ist umso größer, je besser sich der aufgezeigte kausale Zusammenhang auf andere Personen, Situationen und Zeitpunkte verallgemeinern lässt
  • Kausalität Zusammenhang zwischen Ursache und Wirkung
  • Dichotomie komplementäres Begriffspaar, Einteilung eines Gegensatsbereiches in zwei einander komplementäre Bereiche
  • Interne Konsistenz Maß dafür, wie die Items einer Skala miteinander zusammenhängen ist durch cronbachs alpha zeigbar
  • Non-Response und unit-nonresponse Definition, Problem und Auswirkung Non-response: partielle Antwortausfall, zB wenn man auf gewissen Fragen wie zB sehr sensitive Fragen die Antwort verweigert Unit-Nonresponse: Wenn alle Angaben der Zielperson fehlen, häufigste Ursache ist hierbei wenn die Zielpersonen nicht auffindbar sind, die Person sich komplett verweigert Problem hierbei ist, dass wenn die Ausfälle nicht zufällig erfolgen, so ist die resultierende Stichprobe idR verzerrt. Auswirkungen MW (=mittlerwert), NAP =Anzahl nicht antwortende Personen  AP (Anzahl der ANtwortenden Personen d= (MW AP - MW NAP) * (NAP/ NAP + AP)
  • Single-Item scale konkrete Konstrukt Genauigkeit Eindimensional viele überflüssige Items (unnütze Itemredundanz) begrenzte Auswahl
  • Beispiel für ein formatives Messmodell Jobzufriedenheit
  • Beispiel für ein reflektives Messmodell mathematische Fähigkeit
  • 5. Aspekt der KR Schwache Form der Duhem Quine These Theorie kann immer nur vor dem Horizont anderer Theorien überprüft werden Die Gültigkeit der Hintergrundtheorien muss in dem jeweiligen Überprüfungskontext natürlich auch als unproblematisch vorausgesetzt werden.
  • Eindimensional (single item) vs Mehrdimensional (multi Item) Eindimensional: Indikatoren erfassen nur ein gemeinsames Merkmal Mehrdimensional: Konstrukt besteht aus mehreren Dimensionen die zwar miteinander in Beziehung stehen aber eigenständig sind
  • Vollerhebung und ihre Vorteile Datenerhebung bezieht alle Merkmalsträger einer Grundgesamtheit mit ein Vorteile: -Stichprobenfehler entfällt-Umfang der interessierenden Grundgesamtheit ist klein-Grundgesamtheit unter Umständer sehr heterogen in Bezug auf die interessierenden Merkmale
  • Teilerhebung und ihre Vorteile Datenerhebung bezieht nur einen teil der Merkmalsträger einer Grundgesamtheit mit ein (Auswahl) Vorteile kostengünstiger schneller durchführbar, somit auch aktueller genauere Ergebnisse
  • df und a bei chi bzw x^2 Df=1 a=0,05
  • Einfaktorielle VA df und a dfinn: 12 (15-3) dfzw: 2 (5-3)
  • Interne Validität Definition Treatment ist tatsächlich für die Variation der abhängigen Variable verantwortlich (dh Alternativerklärungen können ausgeschlossen werden)
  • inhaltsvalidität wenn ausgewählte Items das zu messende Konstrukt adäquat repräsentieren
  • Interne validität Definition Treatment ist tatsächlich für die Variation der abhängigen Variable verantwortlich (alternativerklärungen können ausgeschlossen werden).
  • Mehrstufige Auswahlverfahren Nehmen Zufallsstichproben in mehreren Stufen vor die jeweils entstehende Zufallsstichprobe bildet die Auswahlgrundlage der nachfolgenden
  • Beispiel einer dreistufigen Zufallsstichprobe bzw, beispiel eines Mehrstufigen Auswahlverfahren Typische Zufallsstichprobe: Deutschlandweite Bevölkerungsumfrage (idR dreistufig) 1) Flächenstichprobe (zB Stimmbezirke oder Straßenabschnitte: Auswahl der Primäreinheiten zB durch PPS Stichprobe mit Kumulationsverfahren                          2) Haushaltsstichprobe (Auswahl der Sekundäreinheiten, zB über Random-Route-Verfahren) 3) Individuenstichprobe (Auswahl der Tertiäreinheiten z.B. über Schwedenschlüssel)
  • Vorteile der Vollerhebung Stichprobenfehler entfällt Umfang der interessierenden GG ist klein (zB Unternehmen einer speziellen Branche, Mitarbeiter eines Unternehmens) GG evtl sehr heterogen in Bezug auf die interessierenden Merkmale (dh Lageparameter sind zB nur von geringer Aussagekraft)
  • Vorteile der Teilerhebung kostengünstiger schneller durchführbar, somit auch aktueller präzisere Ergebnisse (z.B. bessere Schulung der Interviewer, bessere Kontrollmöglichkeiten bei interviewern und Datenfehlern) einzige Option bei Zerstörung oder wesentlicher Beeinträchtigung des Merkmalträgers (z.B. bei Qualitätskontrollen)
  • Probleme bei einfachen Zufallsauswahlen (4) Elemente einer GG nicht immer alles identifizierbar (zB wenn vollständige Adressenliste fehlt) u.U. hoher Aufwand bei der Begfragung (z.B. bei persönlichen Interviews aufgrund geografisch weiträumig verteilter Elemente) Komplexe Zufallsstichproben führen u.U. zu präziseren Schätzungen Untergruppen mit geringen Anteil an der Grundgesamtheit sind u.U. in der Stichprobemit so geringen Fallzahlen vertreten, dass eine statistische Auswertung dieser Gruppen unmöglich/problematisch ist
  • Einfache Zufallsauswahl Merkmale -Auswahlwahrscheinlichkeit ist für jeden Merkmalsträger gleich (dh. sie entspricht 1/N) -Auswahl erfolgt direkt in einem einstufigen Auswahlvorgang
  • Beispiel für eine Einfache Zufallsauswahl Lotterieverfahren, Ziehen jeder nten Karten Zufallszahlen die mit zufallszahlengeneratoren gewonnen werden usw
  • t-Test ist robust gegen Verletzungen, wenn.... Gruppengrößen annähernd gleich groß sind Gruppengrößen nicht zu klein dh größer als 30 sind
  • Was für nicht-parametrische Tests gibt es? Mann-Whitney-U-Test fehlende Voraussetzungen für die Robustheit des t-Test bei unabhängigen Stichproben ordinalskalierte abhängige Variable Wilcoxon Test fehlende Voraussetzung für die Robustheit des t-Test bei abhängigen Stichproben ordinalskalierte abhängige Variable
  • Problem bei den Mehrstufigen Auswahlverfahren Stimmbezirke, Kreise oder Straßenabschnitte weisen große Unterschiede in der Anzahl der Haushalte auf Elemente aus großen Stimmbezirken weisen kleinere Auswahlwahrscheinlichkeit auf, als Element aus kleineren Stimmbezirken (EPSM eigenschaft nicht mehr vorhanden!) Lösung des Problems: PPS  (probability proportional to size) Designs