Forschungsmethoden (Fach) / 1. Stichprobe und Population (Lektion)
In dieser Lektion befinden sich 23 Karteikarten
I + II
Diese Lektion wurde von Frena erstellt.
Diese Lektion ist leider nicht zum lernen freigegeben.
- Was sind die 4 Schätzkriterien für die Beurteilung der Tauglichkeit einer Punktschätzung nach Fisher? Erwartungstreue:Ein Stichprobenkennwert schätzt den entsprechenden Parameter einer Population erwartungstreu, wenn der Mittelwert der Werte für zufällig aus der Population gezogene Stichproben mit dem Populationsparameter identisch ist.- Mittelwert ist ein erwartungstreuer Schätzer von µ.- rel. Häufigkeit p ist ein erwartungstreuer Schätzer von π.- Stichprobenvarianz s2 ist KEIN erwartungstreuer Schätzer der Populationsvarianz σ2. Konsistenz:Ein Stichprobenkennwert schätzt den entsprechenden Populationsparameter konsistent, wenn sich der Stichprobenkennwert mit wachsendem Stichprobenumfang an den Populationsparameter annähert (konvergiert).- Mittelwert, p, s2 sind konsistente Schätzer der entsprechenden Populationsparameter. Effizienz:Ein Stichprobenkennwert schätzt einen Populationsparameter effizient, wenn die Varianz der Verteilung dieses Kennwertes kleiner ist als die Varianzen der Verteilungen anderer Kennwerte, die auch zur Schätzung dieses Parameters geeignet sind.Die Effizienz charakterisiert damit die Genauigkeit einer Parameterschätzung.Die relative Effizienz gibt an, welcher von mehreren verschiedenartigen Kennwerten für die Schätzung eines Populationsparameters vorzuziehen ist. Suffizienz:Ein Schätzwert ist suffizient (erschöpfend), wenn er alle in den Daten einer Stichprobe enthaltenen Informationen berücksichtigt, sodass man durch Berechnung eines weiteren statistischen Kennwertes keine zusätzlichen Informationen über den zu schätzenden Parameter erhält.- p ist ein suffizienter Schätzer von π.- Mittelwert und Varianz sind zusammengenommen (aber nicht einzeln) bei normalverteilten Zufallsvariablen suffiziente Schätzer von μ und σ2.
- Methoden der Punktschätzung: Methode der kleinsten Quadrate Schätzungen werden so vorgenommen, dass die quadrierten Abweichungen der geschätzten Werte von dem Modell minimal sind. V.a. bei Regressionsanalyse eingesetzt, um die Regressionsgerade so durch die Punktwolke der Messwertpaare zu legen, dass die quadrierten Abweichungen der Messwerte von der Regressionsgeraden minimiert werden. Kleinstquadratschätzer sind erwartungstreu und konsistent.
- Methoden der Punktschätzung: Maximum-Likelihood-Methode Soll zeigen, welcher der möglichen Populationsparameter angesichts eines Stichprobenergebnisses die höchste Likelihood (Plausibilität) aufweist. Maximum-Likelihood-Schätzungen sind nicht unbedingt erwartungstreu,aber konsistent, effizient und suffizient. V.a. bei Strukturgleichungsmodellen und in der probabilistischen Testtheorie eingesetzt. Das Maximum der Likelihoodfunktion gibt an, bei welcher Parameterausprägung die vorliegenden Daten am wahrscheinlichsten wären.
- deduktiver vs. induktiver Ansatz Deduktiver Ansatz:Der Wahrscheinlichkeit (Probability) ist zu entnehmen, wie häufig verschiedene, einander ausschließende Stichprobenergebnisse zustandekommen, wenn ein bestimmter Populationsparameter vorliegt. Induktiver Ansatz:Likelihood (rel. Häufigkeit/Plausibilität) --> Anhand eines Stichprobenergebnisses wird geschätzt, wie plausibel/"wahrscheinlich" verschiedene Populationsparameter als die Erzeuger dieses Wertes anzusehen sind.
- Intervallschätzer: Zentrales Grenzwerttheorem Die Verteilung von Mittelwerten aus Stichproben des Umfanges n, die einer beliebig verteilten (z.B. linkssteilen) GG entnommen werden, entspricht einer Normalverteilung, vorausgesetzt n ist genügend groß (n≥30).
- Intervallschätzer: Konfidenzintervall = Wertebereich, der den gesuchten Populationsparameter mit einer vorab definierten Wahrscheinlichkeit beinhaltet. Ist abhängig vom Standardfehler (welcher wiederum abhängig ist von der Standardabweichung und der Stichprobengröße). Bezieht Stichprobenverteilungen mit ein. Kann sowohl als exploratives Verteilungsmaß genommen, als auch als weiterführender Signifikanztest verwendet werden.
- Probabilistische vs. nicht-probabilistische Stichproben Probabilistische Stichprobe: Die Ziehungswahrscheinlichkeit jedes Elementes ist bekannt. Selektion findet mittels eines objektiven Zufallsmechanismus statt. Rückschlüsse auf Population sind somit zulässig. Elemente müssen bekannt sein. Ggf. sehr aufwändig. Nicht-probabilistische Stichprobe: Die Ziehungswahrscheinlichkeiten sind unbekannt. Selektion findet mittels eines subjektiven Kriterium (z.B. Verfügbarkeit) statt. Rückschlüsse auf die Population sind nicht zulässig/nicht generalisierbar. Häufig viel ökonomischer. --> Probabilistische Stichproben haben eine höhere Aussagekraft, können aber pragmatisch schwer zu erreichen/teuer/aufwändig sein.
- Probabilistische Stichprobe: Einfache Zufallsstichprobe jedes Element der Population muss bekannt sein. jedes Element hat die gleiche Ziehungswahrscheinlichkeit. Probleme: Selten lässt sich wirklich jedes Element erfassen (Unterschied Grundgesamtheit und Auswahlgesamtheit). Nicht jedes Element ist zu einer Teilnahme bereit (Unterschied Auswahlgesamtheit und Inferenzpopulation). Auswahlgesamtheit: umfasst alle Elemente, die eine prinzipielle Chance haben, in eine Stichprobe zu gelangen (z.B. registrierte Einwohner). Inferenz-Population: mit einem Ziehungsverfahren tatsächlich erreichte GG (Teilnahmebereitschaft).
- Nichtprobabilistische Stichprobe: Ad hoc Stichprobe / Gelegenheitsstichprobe wird aus freiwilligen Probanden gebildet. es werden die gerade verfügbaren Probanden genommen. oft bei Experimenten bzw. Quasiexperimenten. Problematisch, da Freiwillige nicht notwendigerweise die Population repräsentieren, sondern zeigen im Vergleich zu Nichtteilnehmern häufig... bessere schulische Ausbildung (bessere Notendurchschnitte) bessere Schätzung eigenes sozialen Status höhere Intelligenz höheres Bedürfnis nach sozialer Anerkennung höhere Geselligkeit, oder sind unkonventioneller eher weiblich weniger autoritär
- Probabilistische Stichprobe: Klumpenstichprobe Population muss aus Subpopulationen (wie Institutionen o.ä.) bestehen, welche die gesamte Population vollkommen abdecken. Es muss also eine Liste aller Subpopulationen geben (allerdings müssen nicht alle Elemente bekannt sein!). Jedes Element darf nur einem Klumpen angehören. Der jeweilige Klumpen wird dann vollständig erhoben (--> Vollerhebung des Klumpens) Vorteil: geringer Zeitaufwand Der Gesamtmittelwert kann nur dann ein erwartungstreuer Schätzer für den Populationsmittelwert sein, wenn die einzelnen Klumpen gleich groß sind und Zufallsstichproben der Gesamtpopulation darstellen. Klumpen sollten keine klumpenspezifischen Besonderheiten aufweisen (sehr selten der Fall). Klumpen sollen in sich möglichst heterogen sein und zwischeneinander möglichst homogen. Standardfehler einer Klumpenstichprobe: Klumpen sind frei von Stichprobenfehlern, da sie vollständig erhoben werden. Standardfehler basiert ausschließlich auf der Varianz zwischen den Klumpen. Die Größe des Standardfehlers ist abhängig vom Abstand der einzelnen Klumpenmittelwerte vom Gesamtmittelwert. Je homogener die Klumpenmittelwerte sind, desto kleiner ist der Standardfehler. Beispiel: Studenten von bayrischen Studentenwohnheimen: vollständige Liste erstellen --> Zufallsauswahl --> Vollerhebung innerhalb gezogener Wohnheime.
- Probabilistische Stichprobe: Geschichtete Stichprobe Alle Elemente der Population werden entsprechend eines Merkmales zunächst in mehrere Schichten aufgeteilt. Das Merkmal der Schichtung sollte mit den untersuchten Variablen zusammenhängen. günstige Schichtungsmerkmale sind soziodemografische Merkmale (z.B. Alter, Geschlecht, Bildungsstand, Schulform, soziale Schicht etc.). Aus der Schicht wird eine einfache Zufallsstichprobe gezogen (--> alle Elemente müssen bekannt sein, inkl. dem Merkmal, nach dem geschichtet wird). Die Größe der Schichten kann gewählt werden. Mittelwert einer geschichteten Stichprobe: Der Gesamtmittelwert wird als gewichtete Summe der Einzelmittelwerte (der jeweiligen Schichten) berechnet. Die Gewichtung hängt jeweils vom Anteil der Schichtstichprobe am Gesamtstichprobenumfang ab. Der Gesamtmittelwert kann nur dann ein erwartungstreuer Schätzer für den Populationsparameter sein, wenn die Elemente der Schichten jeweils zufällig ausgewählt wurden. Standardfehler: Da jede Schicht eine einfache Zufallsstichprobe darstellt, basiert der Gesamtstandardfehler auf den Standardfehlern der einzelnen Schichten. Die Genauigkeit der Schätzung hängt davon ab, welchen Anteil die Schichten jeweils an der Gesamtstichprobe haben und wie groß ihre Varianz ist. Verbesserung der Schätzgenauigkeit gegenüber einfacher Zufallsauswahl, wenn die Varianzen in den Schichten kleiner sind als in der Gesamtstichprobe --> Schichten sollten möglichst homogen sein. Beispiel: Studenten Uni Bamberg; Schichtung anhand Studiengang; je einfache Zufallsauswahl getroffen
- Probabilistische Stichprobe: Geschichtete Stichprobe: verschiedene Schichtungsmerkmale Gleiche Aufteilung Die Stichproben je Schicht sind gleich groß Proportionale Aufteilung Die Stichprobengröße je Schicht entspricht der Verteilung (prozentual). Die Stichprobe ist selbstgewichtend (rechnerisch leichter zu handhaben). Optimale Aufteilung Auswahl der Schichtgrößen „nach Bedarf“, z.B. nach der Genauigkeit der Stichprobenmittelwerte in den Schichten: --> Streuung des Stichprobenmittelwerts reduziert sich (zusätzlich zum Schichtungseffekt) durch geeignete Auswahl der Schichtgrößen.
- Probabilistische Stichprobe: Geschichtete Stichprobe: Gewichtung Geschichtete Stichproben müssen nicht selbstgewichtend sein. Bei optimaler/dispropotionaler Schichtung kommt es zurÜberrepräsentierung (z.B. durch besonderes Forschungsinteresse) oderUnterrepräsentierung einzelner Schichten.--> und die Stichprobe gewichtet sich nicht mehr selbst. Eine Gewichtung muss diese Repräsentativität herstellen. Hierfür müssen Stichprobenanteile entsprechend ihrem Vorkommen in der Population bei statistischen Analysen stärker oder schwächer berücksichtigt werden.
- Nichtprobabilistische Stichprobe: Quotenstichprobe Die Stichprobe wird durch vorher definierte Quoten hinsichtlich bestimmter Merkmale gebildet. Das Merkmal, nachdem Quoten gebildet werden, sollte mit den eigentlichen Variablen korrelieren. Innerhalb jeder Quote wird eine Gelegenheitsstichprobe gezogen. Ziel: Die Zusammensetzung der Stichprobe hinsichtlich ausgewählter Merkmale den Populationsverhältnissen durch bewusste Auswahl „passender“ Objekte anzugleichen. es wird jedoch keine Zufallsauswahl gezogen, daher ist keine Verallgemeinerung zulässig. Statistische Kennwerte wie Standardfehler dürfen nicht interpretiert werden. Eine spätere Gewichtung einer ad-hoc Stichprobe ist möglich. Beispiel: Schüler von Schulen einer Stadt; Quotierung entsprechend des Erwerbsstatus der Mutter; Ziehung unter interessierten Eltern unter Berücksichtigung der Quote.
- Nichtprobabilistische Stichprobe: Theoretische Stichprobe Gezielte Auswahl von Elementen nach theoretischen Gesichtspunkten. Die Auswahl eines spezifischen Elements, das bestimmte Merkmale trägt, steht im Vordergrund. Lohnt sich im besonderen bei qualitativer Forschung. z.B. die Auswahl besonders typischer, interessanter oder extremer Fälle.
- Probabilistische Stichprobe: Mehrstufige Stichprobe Eine mehrstufige Stichprobe ist die schrittweise Ziehung einer Stichprobe. Dies ist dann sinnvoll, wenn die Strukturen der Population komplex sind oder einzelne Klumpen zu groß sind. Dies kann sowohl das mehrmalige Durchführen einer Ziehungsart sein als auch das kombinieren verschiedener Ziehungsarten. Eine mehrstufige Stichprobe kann beliebig viele Ziehungsschritte beinhalten. Beispiel: Schichtung nach Schulform und Bundesland; implizite Schichtung nach Schulgröße Ziehung von Schulen (Klumpenstichprobe) Ziehung von Schülern in Schulen
-
- Erläutern Sie den Bayes-Ansatz! Bei Parameterschätzungen nach dem Bayes'schen Ansatz werden Stichprobeninformationen und das Vorwissen der Forscher integriert. Parameterschätzungen berücksichtigen beobachtete Daten und Vorinformationen der Forscher. Wahrscheinlichkeiten werden als Grad subjektiver Glaubwürdigkeit interpretiert. Mit dem Bayes-Theorem lassen sich bedingte Wahrscheinlichkeiten berechnen, etwa Wie wahrscheinlich ist ein Ereignis A, wenn ein Ereignis B eingetreten ist? Wie wahrscheinlich ist A die Ursache, wenn ein Befund B aufgetreten ist? Wie wahrscheinlich ist eine Hypothese H, wenn D beobachtete wurde? Bayesianische Inferenz Über bayesianische Statistik lässt sich die Wahrscheinlichkeit der Hypothese anhand beobachteter Daten ermitteln. --> Beobachtungen (Evidenzen) können den Grad der Glaubwürdigkeit einer gegebenen Hypothese beeinflussen. subjektiver Wahrscheinlichkeitsbegriff Prinzip des bayesianischen Schätzen: Posterior = Likelihood x Prior Posterior:Ergebnis = Wahrscheinlichkeit der Hypothese unter Berücksichtigung der gefundenen Daten. Likelihood:Berechnung der Wahrscheinlichkeit, die vorliegenden Daten zu erhalten, wenn Hypothese stimmt. Prior:Verrechnung mit Vorwissen/Vorannahmen über die Wahrscheinlichkeit der Hypothese. Im Gegensatz zum Signifikanztest können im Bayes-Ansatz beliebig viele Hypothesen verglichen werden.
- Was versteht man unter einer Prior-Verteilung? Die Priorverteilung ist die Zusammenfassung des Wissens und der Annahmen der Forscher vor der Datenerhebung. Diese können z.B. auf Grund von vorangegangen Untersuchungen, Expertenwissen, Literaturrecherche etc. entstehen. Wenn keine Vorannahmen vorliegen, können sogenannte uninformative oder diffuse Priorverteilungen gewählt werden. --> Mit einer uninformativen oder diffusen Priorverteilung, d.h. mit einer Gleichverteilung, die keine Unterschiede zwischen den Hypothesen macht, zählen nur noch die Beobachtungen, genau wie im Signifikanztest. Die Auswahl der Priorverteilung ist besonders bei kleinen Stichproben entscheidend. Die Priorverteilung soll nicht die Daten dominieren (z.B. durch zu stringente Vorgaben). Überprüfen verschiedener Priorverteilungen, um den Einfluss der Priorverteilung abschätzen zu können. Der Einfluss der Priorverteilung wird umso geringer, je mehr Beobachtungen eingehen.
- Beispiel: Formulieren Sie eine Forschungsfrage für den Signifikanztest vs. bayesianische Inferenz Signifikanztest: Gibt es Grund an einer Gewinnquote von 50% zu zweifeln, wenn Sie 10 Lose gekauft haben, ohne ein einziges Mal zu gewinnen? (--> dichotomes Ergebnis: ja/nein) Bayesianischer Test: Wie wahrscheinlich ist eine Gewinnquote von 50%, wenn Sie 10 Lose gekauft haben, ohne ein einziges Mal zu gewinnen? (--> Ergebnis: Wahrscheinlichkeit)
- Schätzungen mit dem Bayes-Ansatz Vorwissen wird durch Priorverteilung berücksichtigt.Zusammen mit den Ergebnissen einer Untersuchung (die Likelihood) wird eine Posteriori-Verteilung für Parameter oder Hypothesen ermittelt --> die Posteriori-Verteilung stellt das Ergebnis dar. Je mehr beobachtete Ergebnisse eingehen, desto geringer wird der Einfluss der Priorverteilung. Unterschiedliche Priorverteilungen können in Sensitivtätsanalysen verglichen werden (experimentelle Veränderungen). Uninformative Priorverteilungen sind auch möglich.
- Parameterschätzer und Inferenz: Klassische Statistik vs. Bayes-Ansatz Klassische Statistik/Frequentisten Unbekannte Parameter können geschätzt werden. Mit Punktschätzern werden Hypothesen getestet. Ziel: ja/nein Antwort für die Gültigkeit einer Hypothese. Ergebnis unabhängig von Vorannahmen. Bayes-Ansatz Die Posteriorifunktion wird als Wahrscheinlichkeitsfunktion für Parameter oder Hypothesen interpretiert. Vorwissen kann einbezogen werden und verändert das Ergebnis.
- Welche probabilistischen Stichprobenarten gibt es? Einfache Zufallsstichprobe Geschichtete Stichprobe Klumpenstichprobe Mehrstufige Stichprobe Merkmale probabilistischer Stichproben: Die Ziehungswahrscheinlichkeit jedes Elementes ist bekannt. Selektion findet mittels eines objektiven Zufallsmechanismus statt. Rückschlüsse auf Population sind somit zulässig. Elemente müssen bekannt sein. Ggf. sehr aufwändig.
- Welche nichtprobabilistischen Stichprobenarten gibt es? Ad-hoc-Stichprobe Theoretische Stichprobe Quotenstichprobe Merkmale nichtprobabilistischer Stichproben: Die Ziehungswahrscheinlichkeiten sind unbekannt. Selektion findet mittels eines subjektiven Kriterium (z.B. Verfügbarkeit) statt. Rückschlüsse auf die Population sind nicht zulässig/nicht generalisierbar. Häufig viel ökonomischer.
