Evaluation (Fach) / Power- und Effektgrößenanalyse (Lektion)
In dieser Lektion befinden sich 28 Karteikarten
Kap. 6
Diese Lektion wurde von loewi erstellt.
Diese Lektion ist leider nicht zum lernen freigegeben.
- Logik der statistischen Inferenz von R.A. Fischer Wie wahrscheinlich ist das in der Stichprobe gefundene Ergebnis, wenn in der Population die Ho gilt? >>> Falls kleiner als 5%, wird die Nullhypothese verworfen.
- Nachteile des 5-Prozent-Niveaus willkürlich, führt zu schwerwiegenden Entscheidungen und Datenfälschungen. Es wird nach signifikanten Ergebnissen gesucht und diese werden öfter publiziert. > Publication Bias Sinnhaftigkeit bei seltenen Krankheiten nicht gegeben, da zu kleine Stichproben - auch wenn eigentlich großer Mittelwertsunterschied!
- Effektgröße Def. standardisierte Form eines Mittelwertunterschiedes, Zusammenhangsmaßes, Häufigkeitsverteilung. z. B. Cohen's d, f, r, partielles Eta-Quadrat, OR)
- Was bringt die Standardisierung bei der Effektgröße? Relative Unabhängigkeit vom Messinstrument Relative Unabhängigkeit von der Stichprobengröße
- Teststärke Def. = Power Wahrscheinlichkeit, einen in der Population vorliegenden Effekt in einer Studie zu finden (1 minus beta)
- Was ist das Gegenteil von Teststärke? Spezifität - Entscheidung für Ho wenn in der Population auch die Ho gilt. (Wahrscheinlichkeit ist eins minus alpha)
- Welches sind die vier Parameter bei der Signifikanztestung? - Teststärke (Power) - Effektgröße - Alpha-Fehler - Stichprobenumfang N zur Berechnung eines der Parameter müssen die anderen vorhanden sein.
- Post-Hoc-Poweranalyse Wenn ermittelte Effektgröße bedeutsam ist, aber der Test nicht signifikant weil die Stichprobe zu klein, >>> kann man die Teststärke bestimmen! in wieviel % der Stichprobe hätte man diesen Effekt gefunden, wenn er in der Population tatsächlich in dieser Größe vorliegt? Teststärke wird berechnet aus Alpha (wird festgelegt) N (steht schon fest) Effektgröße (wurde empirisch ermittelt)
- A priori-Poweranalyse in der Studien-Planungsphase: Wieviele N werden gebraucht, damit die Wahrscheinlichkeit, einen Populationseffekt von der Größe X (Effektgröße) zu finden, z. B. 80% ist? (Bei Signif.niveau von 5%)? Berechnen des optimalen Stichprobenumfangs aus Alpha (wird festgelegt) Effektgröße (wird festgelegt) Teststärke wird festgelegt
- Optimaler Stichprobenumfang - was muss erwogen werden? Wie groß muss die Stichprobe sein, damit erwartete Effekte auch statistisch abgesichert werden können? Kann man diese Stichprobengröße überhaupt erreichen? (Kosten, Aufwand, Zeitfaktor) Wie groß darf sie maximal sein, damit der statistisch signifikante Effekt auch praktisch relevant ist? (z. B. Kostenersparnis)
- Festlegung der Effektgröße (vor Studienbeginn) - bei der Bestimmung der Stichprobengröße sehr komplizierter Aspekt. Möglichkeiten: - mittels Pilotstudie abschätzen - schauen, welche Effektgrößen ähnliche Studien erbracht haben - kleinste interessierende Effektgröße definieren (eine Art Cut-Off) - Falls Obergrenze für Stichprobengröße besteht: Sensitivitätsanalyse
- Sensitivitätsanalyse Problem in der Planungsphase: Es können max. N Teilnehmer rekrutiert werden. Dann berechnet man die Populations-Effektgröße mit der maximal möglichen Stichprobengröße.
- Notation von Effektgrößen bei empirisch gefundenen Effektgrößen: Kleinbuchstaben. bei angenommenen Effektgrößen in einer Population: Großbuchstaben.
- Effektgröße bei: 2 Gruppen, AV intervallskaliert (t-Test) d
- Effektgröße bei: mehr als 2 Gruppen, AV interv.sk. einfakt. Anova>>> f
- Effektgröße bei Korrelation (IV-Skaliert) r
-
- Effektgröße bei: multiple Korrelation f zum Quadrat.
- Effektgröße bei: Mehrfaktorielle ANOVA partielles Eta-Quadrat
- 2 kategoriale Variablen Chi-Quadrat w
- 2 kategoriale Variablen Odds Ratio OR
- Interpretation Cohens d bis 0,2 klein bis 0,5 mittel bis 0,8 groß Aber: Interpretation abhängig vom Forschungsgegenstand.
- Cohens d: Varianten, wenn die Gruppen unterschiedliche Standardabweichungen haben. 1. Streuungen in beiden Gruppen mitteln. 2. Gewichtung der Streuung an der Gruppengröße (Hedges g) 3. Streuung der KG verwenden: Nur wenn mehere EGs mit der KG verglichen werden!
- Cohens d bei Wiederholungsmessungen an welcher SD soll die Prä-Post-Differenz standardisiert werden? 1. SD der Prä-Werte (Cohen/Kazis) 2. Standardizes Response Mean (SD der Prä-Post-Differenzwerte) Vorsicht: unterschiedliche Interpretationen! Vorsicht bei sehr zeitstabilen Merkmalen, da dann die Differenzwerte sehr wenig streuen (?).
- Odds Ratio geeignet für bsp. selten auftretende Ereignisse, Epidemiologie Beschreibt das Verhältnis der Wahrscheinlichkeit dass das Ereignis eintritt zur Wahrscheinlichkeit, dass das Ereignis nicht eintritt.
- OR Interpretation 1: kein Unterschied zwischen den Bedingungen. größer 1: Risiko für ein Ereignis (z. B. 1,6 mal erhöht) kleiner 1: Schutzfunktion der Gruppenzugehörigkeit
- Forderungen beim Berichtlegen des Effektgrößenmaßes d Transparente Darstellung aller deskriptiven Kennwerte>> dann können weitere Effektgrößenmaße ermittelt werden Transparente Darstellung der berücksichtigten Streuung/Art der Berechnung>>>bessere Vergleichbarkeit Bewertung der ermittelten Effektgröße durch Vergleich mit ähnlichen Populationen, Interventionen, Studien (nicht nur mit Vorschlag von Cohen)
- Berichtlegung von Effektstärken nach CONSORT Dokumentation der gefundenen Effektgrößen! Bei Publikation von RCTs: Beschreibung des Vorgehens bei der Schätzung der benötigten Stichprobengröße!
- Empfehlungen von Cohen "How to use statistics" Gute Versuchsplanung bezgl. Stichprobengröße, Alpharisiko, Power Detaillierte deskriptive Datenanalyse, auch graphisch nicht blind auf 5-% signifikanzniveau vertrauen Effektgrößen, Konfidenzintervalle und p-Werte berichten