Psychologie (Subject) / Forschungsmethoden der Psychologie (Lesson)
There are 205 cards in this lesson
Karten zu Kurs 3401
This lesson was created by Annkathete.
- X.12.1.Ein Test: Zwei Definitionen Allgemein: Ein Test ist ein Verfahren zur Gewinnung diagnostisch relevanter Daten. Im engen Sinn: (Cattel & Warburton 1967) Verfahren, mit dem Daten unabhängig von subjektiven Urteilen und Einschätzungen des Probanden erhoben werden können. (Undurchschaubarkeit bei Fähigkeits- und Leistungstests) Breitere Fassung: (Lienert &Raatz 1998) Wissenschaftl. Routineverfahren zur Untersuchung eines oder mehrerer empirisch abgrenzbarer Persönlichkeitsmerkmale mit dem Ziel einer möglichst quantitativen Aussage über den relativen Grad einer individuellen Merkmalsausprägung.
- X.12.3. Testtheorie: Beschreibung aller vier Schätz-Methoden zur Sicherung der Reliabilität: Split Half-Methode, Paralleltestmethode, Interne Konsistenz (Cronbachs Alpha) und Retest-Relaibilität Reliabilität (Messgenauigkeit; mehrere Einzelmessungen desselben Konstrukts erreichen Messgenauigkeit im Gesamtergebnis) Split-Half / Halbierungsmethode Der Test mit seinen Items wird in zwei gleich große Hälften aufgeteilt. Wie korrelieren die beiden Hälten miteinander? Paralleltestmethode: Ein ähnlicher Test wird mit gewissem zeitlichen Abstand der selben Probandengruppe vorgelegt. Die Test sind theoretisch dann parallel, wenn sie dieselben wahren Werte und Fehlervarianzen aufweisen Interne Konsistenztestung: Cronbachs Alpha Koeffizient: Interne Konsistenz misst, inwieweit die Items einer Skala miteinander zusammenhängen. Jedes Item wird als eigener Testteil interpretiert. Dies funktioniert, wenn über diese Items nur ein einziges eindimensionales Merkmal erfasst werden soll. Cronbach Alpha liefert dann die mittlere Konsistenz über alle möglichen Items. (Wie korrelieren die Ergebnisse bei den einzelnen Items miteinander ?) Retest-Reliabilität: Ein und derselbe Test bei den gleichen Probanden. Besonders für die zeitliche differenzielle Stabilität und Transsituative Konsistenz, etwa bei Persönlichkeitstests. Ergebnisse dieser Schätzungen sind als Reliabilitäts-Koeffizienten quantifizierbar und liegen dann zwischen 0 und 1. Ein guter Wert liegt über 0,8. Störanfällig über die Zeit, durch Lern und Wachtsumseffekte.
- X.12.4. Testtheorie: Was bedeutet Validität und welche drei Arten von Validität werden unterschieden ? Ein Test ist valide, wenn er das misst, was er messen soll. In psychometrischen Tests werden - anstatt beobachtbarer Merkmale - mittels Leistungstests und Persönlichkeitstests latente Variablen gemessen. Die Fragestellung: Sind die jeweiligen Items im Test tatsächlich Indikatoren für diejenigen latenten Merkmale, die man messen möchte ? Bei der Frage nach der Validität geht es um die Güte der Operationalisierung des interessierenden Merkmals: Stellt der Test eine gelungene Operationalisierung der latenten Variablen dar, die gemessen werden sollen ? Folgende drei Arten von Validität werden unterschieden: - Inhaltsvalidität / Kontentvalidität- Kriteriumsvalidität - Konstruktvalidität
- X.12.4. Was ist mit "Basaler Interpretation von Testergebnissen" gemeint? Basale Interpretation ist die Einteilung von Messergebnissen in die Grobkategorien: Unterdurchschnittlich, durchschnittlich und überdurchschnittlich.
- X.12.5. Was bedeutet "Augenscheinvalidität" ? Die Fragestellung bei der Augenscheinvalidität lautet: Inwieweit ist das mit einem spezifischen Test gemessene Merkmal auch für Laien evident? Sie ist bedeutsam für die allgemeine Akzeptanz eines Tests.
- X.12.5. Konzept des nomologischen Netzwerks Konzept des nomologischen Netzwerks Dieses Konzept ist bedeutsam für die Kontruktvalidität. Ob Der Test wirklich misst, was er messen soll, ist Kriterium der Validität. Was ein Test messen soll ist ein bestimmtes theoretisches Konstrukt ( z.B. "Aufmerksamkeit", "Intelligenz") Das Konzept des nomologischen Netzwerks beschreibt wiederum, wie ein Konstrukt, wie z.B. Intelligenz wissenschaftlich in Gesetzmäßigkeiten eingebettet ist. Beschäftigt sich z.B. mit der Frage: "Was wird wissenschaftlich als "Intelligenz" bezeichnet. Welche beobachtbaren Variablen können zu den Gesetzmäßigkeiten genannt werden?
- X.12.6. Tests: Was sind konvergente (Übereinstimmungsvalidität) und divergente (diskriminante) Validität Diese beiden Begriffe gehören in den Bereich der Konstruktvalidität. Es geht um Beziehungen von Tests, welche ein ähnliches Merkmal messen. Können beim Messen deutlich postitive Beziehungen zu Tests, die ein sehr ähnliches Merkmal messen, festgestellt werden, spricht man von konvergenter Validität oder Übereinstimmungsvalidität. Divergente oder diskriminante Validität bezeichnet dagegen die Unabhängigkeit / sehr niedrige Korrelation oder Nullkorrelation der Testwerte, bei theoretischer Überschneidung von Konstrukten. Möchte man die Faktoren eigener Test von denen anderer Tests abgrenzen, welche ein anderes Konstrukt messen (Etwa bei Test zur Depressivität versus Test zu Fatigue jeweils bei neurologischen Erkrankungen) freut man sich über diskriminante / divergente Validität.
- X.12.6. Tests: Welche 3 Nebengütekriterien sind zu nennen? - Eichung /Normierung eines Tests: Wichtig bei Einzeldiagnostik, Bezugssystem mit Werten einer Vergleichsgruppe mit Mindestkriterien (Alter, Geschlecht) - Testfairness: werden ethnische soziallkuturelle, geschlechtl. Gruppen gleichbehandelt? - Testökonomie: Relation zeitl. finanzielle Faktoren zum Erkenntnisgewinn
- X.13.0. Datenerhebung: In welche drei Kriterien werden die unterschiedlichen 10 Datenquellen nach Pawlik klassifiziert? 1. Datenmodalität Werden Mentale Repräsentationen, Direkt beobachtbares Verhalten, oder psychophysiologisch erfassbare Variablen untersucht? 2. Erfassbare Varianz Wird die Datenuelle im Labor und/oder im Feld erhoben? 3. Reaktionsobjektivität Inwieweit beeinflussen Einstellungen Werte und Ziele von Probanden die Datenquelle?
- X.13.1. Zehn Datenquellen nach Pawlik (Aufzählung) 1. Biographische und Aktuardaten 2. Verhaltensspuren 3. Verhaltensbeobachtung 4. Verhaltensbeurteilung 5. Ausgdrucksverhalten 6. Interview 7. Projektive Tests 8. Objektive Tests 9. Fragebogen 10. Psychophysiologische Diagnostik
- X.13.2. Wie unterscheiden sich Verhaltensbeobachtung und Verhaltensbeurteilung? Verhaltensbeobachtung: Direkt beobachtbare Indikatoren, alle wahrnehmbaren Aktivitäten und Änderungen des Zustands einer Person, auch physiologische Reaktionen wie Schwitzen, Erröten etc. Klassifizierung nach Pawlik: Datenmodalität: beobachtbares Verhalten Erfassbare Varianz: Feld, Labor Reaktionsobjektivität: Sowohl ja als auch nein möglich Verhaltensbeurteilung Mehr oder weniger subjektive und summarische Einschätzungen und Bewertungen der Häufigkeit der Intensität und der Ausprägungsform von Verhalten. Basiert bei Selbst und Fremdbeobachtung am ehesten auf mentalen Repräsentationen von Verhalten. Diese sind weniger in Bezug auf einzelne Mikrozeiträume zu sehen, sondern eher in Bezug auf lange Zeiträume. Bezieht sich v.a. bei der Selbstbeobachtung weitgehend auf vergangene Erfahrungen. Verschmolzene Verhaltensindikatoren. Bsp.: Unsicherheit versus Souveränität in gradierter Ausprägung wie -gar nicht-etwas- ziemlich- sehr) anstatt Einzelkategorien wie z.B.- Anzahl Blickkontakte - Anzahl Versprecher. Klassifizierung nach Pawlik: Datenmodalität: Mentale Repräsentationen Erfassbare Varianz: Feld, Labor Reaktionsobjektivität: sowohl ja als auch nein möglich
- X.13.2. Was sind reduktive Deskriptoren? Reduktive Deskriptoren sind definierte Bestandteile von festgelegten Beobachtungseinheiten, die dann innerhalb einer Stichprobe identifiziert und einer festgelegten Kategorie zugeordnet werden können. Reduktive Deskriptoren beschränken auf bestimmte Beobachtungseinheiten die Verhaltensdetails zusammenfassend charakterisieren.
- X.13.7. Innerhalb welchen psychologischen Paradigmas hat die psychophysiologische Diagnostik an Bedeutung gewonnen? Innerhalb des Kognitionswissenschaftlichen und Neuropsychologischen Paradigmas.
- X.13.4. Wie unterscheiden sich Kategoriesystem und Zeichensystem in Bezug auf ihre Anwendung? Zeichensystem - Bei der wissenschaftlichen Beobachtung von Verhalten wird sich in der Regel auf bestimmte theoretisch relevante Beobachtungseinheiten (Kategorien,Verhaltensklassen) beschränkt. Zum Bsp. auf "Verlegenheitsgesten" . Mehrere solcher Beobachtungseinheiten bilden dann im Gesamten ein soganntes Zeichensystem. Es werden in einem Zeichensystem nur bestimmte interessierende, also nicht nicht alle Verhaltensweisen beobachtet. Kategoriesystem: Dieses wird verwendet, wenn alle zu beobachtenden Verhaltensweisen innerhalb einer Stichprobe identifiziert und erfasst werden sollen.
- X.13.3. Was ist unter Verhaltenspuren zu verstehen? Eine von 10 möglichen Datenquellen nach Pawlik. Verhaltensspuren sind direkt beobachtbare Nachwirkungen menschlichen Verhaltens Sie können mit Persönlichkeitsmerkmalen assoziiert sein. Bsp.: Schwitzen und Sportbekleidung nach dem Joggen, Schreibtischordnung. Datenmodalität: Verhalten Efassbare Varianz: Feld Reaktionsobjektivität: Vorhanden
- X.13.4. Wie ordnet man Biographische Daten /Aktuardaten in die Klassifikation der Datenquellen nach Kurt Pawlik ein? - Datenmodalität: (direkt beobachtbares) Verhalten - Erfassbare Varianz: Feld - Reaktionsobjektivität: vorhanden
-
- X.13.5. Was ist das Facial Action Coding System ? (Paul Ekman und Wallace Friesen) Das Facial Action Coding System ist innerhalb der Datenquelle "Ausdrucksverhalten" anwendbar. International verbreitetes System zur Einordnung mimischer Muskelbewegungen.Sogenannte Action Units (AUs) sind definiert. Zwei Schritte der Einordnung und Auswertung: Zuerst werden die Action Units ohne Bewertung objekt erfasst. Dann mit Hilfe eines Auswertungsprogramms Emotionen zugeordnet. Die Annahme Ekmans u. Friesens nach der die Ausdrucksformen aller Primäremotionen biologisch determiniert sind ist umstritten, jedoch konnte für bestimmte Primaremotionen gezeigt werden, dass sie kulturellübergreifend erkannt werden (Ekel, Wut Angst u.a.)
- X.13.5.Welche Variationen des Ausdrucksverhaltens sind denkbar? Solche Variationen der Mimik, Gestik, Ganzkörpermotorik, Stimme und Sprechweise in denen sich Gefühle Stimmungen und Affekte äußern. Handschrift als Verhaltensspur kann sich unter Stress ändern.
- X.13.6. Welche projektiven Verfahren haben anwendungsbezogene Bedeutung? Projektive Tests geben mehrdeutiges Reizmaterial vor, welches vom Probanden interpretiert, ergänzt oder gestaltet werden soll. Hilfe zur Exploration, vorläufigen Hypothesen und zum Beziehungsaufbau bietet bei Kindern: Der Sceno Test (Mit Spielmaterial; Puppen, Bausteine etc.) Zur Erfassung impliziter Motive (die z.B. durch Fragebögen, die einen bewussten Zugang vorraussetzen, nicht erfasst werden können) dient z.B. der thematische Apperzeptionstest welcher in der Forschung zur impliziten Machtmotivation eine wichtige Rolle spielt.
- X.13.6 Auf welche drei Arten läßt sich ein Interview strukturieren? Freie Exploration: Nur einige wenige Fragen sind festgelegt. Nachfragen hängen vom Verlauf der Exploration ab. Halbstrukturiertes Interview: Festlegung einzelne Bereiche und Fragen, welche in jedem Fall abgehandelt werden, zusätzliches Nachfragen ist erlaubt. Standardisiertes Interview: Fragen und deren Abfolge sind genau festgelegt, Interviewer codiert ggf. auch die Antworten. Wird in der Diagnostik psychischer Störungen eingesetzt. Das Interview ist das in der psychologischen beruflichen Praxisam häufigsten eingesetzte diagnostische Instrument. Es gilt als "zweiter Königsweg" der psychologischen Diagnostik, der "erste Königsweg" ist die standardisierte Beobachtung.
- X.13.3.8 Welche Anforderungen werden für objektive Tests gesetzt? Nach Pawlik: Objektive Tests sind an Testgütekriterien überprüfte Stichproben z.B. von Leistungsaufgaben, über die eine Verhaltensstichprobe der untersuchten Personen am interessierenden Merkmal erhoben und ausgewertet wird. Z.B. ein IQ-Test. Nach Raymond B.Cattell: sind nur die Verfahren objektive Tests, deren Messintention für den Probanden nicht erschließbar ist, die also undurchschaubar sind. Auch in Bezug auf Störfaktoren wie sozialer Erwünschtheit sei ein Test so unverfälschbar. Bsp. Der Subtest „Flächengrößen vergleichen“Aus der Testbatterie AHA – Arbeitshaltungen (Kubinger und Ebenhöh, 1996)Impulsivität vs. Reflexivität werden gemessen, ohne dass die Probanden es merken. Impulsiv: Bearbeitung vieler Flächen (viele Fehler) Reflexiv: Bearbeitung weniger Flächen (wenige Fehler)
- X.14.00 Durch welche beiden Bedingungen ist ein Experiment nach Huber charakterisiert? 1. Der Experimantator variiert systematisch mindestens eine Variable (die unabhängige Variable) und registriert welchen Effekt diese aktive Veränderung bewirkt. (In einer oder mehreren Experimentalgruppen, im Vergleich zu einer Kontrollgruppe, in Bezug auf die Abhängige Variable) 2. Gleichzeitig schaltet er die Wirkung von anderen Variablen aus (mit einer Technik zur Kontrolle von Störvariablen). Ziel des Experiments ist es, die Auswirkungen der unabhängigen Variablen auf die abhängige Variable zu untersuchen. Die unabhängige Variable als Ursache für die abhängige auffassen zu können nennt man auch den sogennanten „Königsweg“ des Experiments.
- X.14.01 Welche drei zentralen Anforderungen an experimentelle Designs werden gestellt? 1. Die Rahmenbedingungen (Untersuchungssettings) müssen in der Versuchsgruppe und in der Kontrollgruppe identisch sein. 2. Die Versuchspersonen als Teil dieser Settings müssen in der Versuchsgruppe und in der Kontrollgruppe aus der gleichen Grundgesamtheit stammen und somit exakt vergleichbar sein. 3. Versuchsgruppe und Kontrollgruppe unterscheiden sich nur durch das Treatment, welches in der Versuchsgruppe realisiert wird.
- X.14.02. Was ist ein "Mere Exposure Effekt"? In psycholog. Studien konnte gezeigt werden, dass die wiederholte Darbeitung eines Reizes zu einer positiveren Bewertung dieses Reizes führt. Mere exposure / bloße Darbietung reicht hier offenbar aus, was kognitionspsychologisch mit impliziten / nicht bewussten Prozessen erklärt wird. Das Objekt kann nach häufigerer Darbietung flüssiger verarbeitet werden.
- X.14.03 Was ist in Experimenten zu beachten, wenn Veränderungshypothesen geprüft werden? Bei Interventionsmaßnahmen möchte man prüfen, ob diese Wirkung zeigen. Mindestens einmal vor und einmal nach der Intervention erfolgt eine Messung der abhängigen Variable mit geeigneten Datenerhebungsmethoden: Prätest und Posttest
- X.14.03 Unterschiedshypothese Unterschiedshypothesen behaupten Unterschiede zwischen Gruppen oder Merkmalen.
- X.14.04. Konfundierung Die Überlagerung der Effekte von kontrollierten Variablen und von nicht kontrollierten Variablen / Störvariablen nennt man Konfundierung.
- X.14.04. Wie kann man Störvariablen kontrollieren? - Störvariablen können als weitere unabhängige Variablen untersucht werden. - Sie können ggf. eliminiert werden (z.B. Lärm) - Sie können konstant gehalten werden. Der Königsweg zur Konstanthaltung von Störvariablen ist die Randomisierung.
- X.14.04. Randomisierung: Vorraussetzungen und Wirkung - Der Stichprobenumfang ist mindestens 60 oder größer als 60. - Die Probanden werden durch Zufall der EG oder der KG zugewiesen. - Störvariablen auf diese Art in den beiden Gruppen gleich verteilt. - Unterschiede so weitestgehend auf das Treatment zurückführbar siehe: ceteris paribus criterium
- X.14.04.a Was kann man tun, wenn die Stichprobe zu klein für Randomisierung ist? In einem Quasiexperiment (etwa einer Studie zur Wirkung eines Lernprogramms an einer Schule) kann Parallelisierung / Matching angewendet werden. Dies ersetzt hier die Randomisierung (erst bei Gruppengrößen größer 60) Um zwei Gruppen mit etwa gleicher Verteilung von Störvariablen zu erhalten (Experimental und Kontrollgruppe vergleichbar) werden zunächst unter den Probanden Paare gebildet. Diese sollten einen ähnlichen Mittelwert im Hinblick auf eine Störvariable aufweisen. (Bsp. gleicher Notendurchschnitt jew. zweier Schüler wird vor einem Lernprogramm ermittelt, um Paare zu bilden.) Erst dann wird per Zufall entscheiden wer aus den Paaren jew. der Kontroll- bzw. Experimentalgruppe zugeordnet wird.
- X.14.05. Within subjects design Between subjects design Bei einem within subjects design werden alle Probanden allen treatments ausgesetzt. (Eselsbrücke: "alle sind within"). Dies kann sehr praktisch sein, wenn man nur eine kleinere Stichprobe zur Verfügung hat und sich bei einer Teilung nicht sicher ist, ob wirklich alle Störvariablen gleich in EG und KG verteilt sind. Z.B. bei mehrstufigen Verfahren. Bei einem between subjects design wird (Eselsbrücke) "between" den treatmens unterschieden, denen einzelne Probanden/Gruppen zugeornet werden. Eine Person wird nur einem treatment zugeordnet. In sehr vielen Studien übliches Design.
- X.14.05. Was sind Mehrfaktorielle Experimente? Die unabhängige Variable oder das Treatment wird auch Faktor genannt. Werden mehrere Faktoren einbezogen / realisiert oder variert spricht man von einem mahrfaktoriellen Experiment. Bsp. Variation eines Faktors: Der Experimenteller Faktor / die UV hat mehrere variierte Stufen. Der Faktor "Training" mit den Stufen "Training I", "Training II" und "Kontrollgruppe/ KG " ( mit weder T1 noch T2) Bsp. mehrere Faktoren: neben dem Training werden noch als Faktoren miteinbezogen: Geschlecht der Pbn. , Dauer der Trainingseinheiten (hoch vs. niedrig) Ein Mehrfaktorielles Experiment hat Haupteffekte und Interaktionseffekte
-
- X.14.05 Interaktionseffekte bei mehrfaktoriellen Experimenten Interaktionseffekte heißen auch Wechselwirkungseffekte Es muss mehr als eine unabhängige Variable wirken, damit ein Intersaktionseffekt zustande kommen kann. Es gibt neben dem Interaktionseffekt auch immer die Haupteffekte (so viele, wie unabhängige Variablen vorhanden sind) Neben den jeweiligen Haupeffekten der einzelnen Faktoren /Treatments/unabhängigen Variablen können die Effekte der Überlagerung dieser Faktoren geprüft werden. Also, wie die beiden Faktoren zusammenwirken. Der Effekt einer Variablen auf eine andere ist unterschiedlich, je nach Zustand einer weiteren. Bsp: 2 Haupteffekte sollen in einem Experiment geprüft werden. Haupteffekt A: Führt das Hören von Musik neben einer bestimmten Aufgabe zu mehr Fehlern bei dieser Aufgabe? Und Haupteffekt B: Führt Hitze zu mehr Fehlern? Zusätzlich kann man die Interaktion der beiden Faktoren prüfen: Ist die Differenz zwischen „mehr Fehlern“und „weniger Fehlern“ größer unter der Bedingung „Hitze“ als unter der Bedingung „Normaltemperatur“? Ein klassischer Interaktionseffekt ist: Der Effekt der einen UV ist abhängig von der Stufe der anderen UV. Wenig Schlaf UV A wirkt bei sich bei schlechten Sichtverhältnissen UV B stark auf Fahrfehler AV aus. Beide unabhängigen Variablen zeigen Haupteffekte. Je nach Stärke der Ausprägung der UV A wirkt die UV B stärker auf die AV, was als Interaktionseffekt bezeichnet wird. Schlechte Sichtverhältnisse bewirken umso mehr Fahrfehler, je weniger die Probanden geschlafen haben.
- X.15.00 Molar-Molekular Unterscheidung zwischen Betrachtungsweisen eines Gegenstandsbereiches. Molar: bezieht sich auf grössere Einheiten, Gebilde, Aggregate eines Gegenstandbereichs. Molekular: analysiert Beziehungen zwischen kleinsten Einheiten, in die sich der Bereich zerlegen lässt.
- X.15.00 Was ist "Local molar causal validity"? Local molar causal validity ist eine Präzison innerhalb des Begriffs der Internen Validität. Local: Die Schlussfolgerungen, die in der Untersuchung gemacht werden, beziehen sich nur auf den lokalen Kontext des Experiments. molar: Die kausalen Schlussfolgerungen sind als Schlussfolgerungen auf ganze "Pakete" zu verstehen. Ein Treatment beeinhaltet unvermeidbar einen ganzen Komplex an Einflüssen (Zeit Ort Dauer u.v.m) Darum kann man eben nicht sagen, dass Validitätsangaben absolut sind. Sie gelten erst einmal für das konkrete Experiment. causal: hier wird unterstrichen, dass es sich auf jeden Fall um eine kausale Schlussfolgerung handelt
- X.15.00 Warum sprechen wir von der relativen Validität einer Aussage ? Validität ist eng mit der Idee der Wahrheit verbunden. Validität ist kein Merkmal eines Designs einer Untersuchung sondern das der Schlussfolgerung. Können wir aus dem Experiment schlussfolgernd zu validen Aussagen kommen? Die Hypothese bestätigt sich vorerst nur für die einzelne Untersuchung, ist relativ und vorläufig und nicht universell zu verstehen. Schlussfolgerungen über allgemeine empirische Zusammenhänge werden aus mehreren Untersuchungen abgeleitet: mit unterschiedlicher Methodik und in unterschiedlichen theoretischen Zusammenhängen.
- X.15.00 Interne Validität und statistische Validität Interne Validität: ist ein Gütekriterium einer empirischen Untersuchung. Ein Experiment ist intern valide, wenn die Messwerte der abhängigen Variable eindeutig auf die Wirkung der unabhängigen Variable rückführbar sind. Wenn das Ergebnis einer Untersuchung also eindeutig interpretierbar ist. Der Einfluss von Störvariablen muss kontrolliert oder ausgeschaltet sein. (Das geht ganz besonders gut unter standardisierten Bedingungen wie sie im Labor gegeben sind.) Statistische Validität: hängt eng mit der Internen Validität zusammen. Die kausale Schlussfolgerung, dass ein Treatment die abhängige Variable kausal beeinflusst hat, erfolgt vor dem Hintergrund statistischer Analyseverfahren. Fehler in diesem Rahmen würden die statistische Validität beeinflussen und somit auch die interne Validität.
- X.15.01 Welche vier Aspekte der Externen Validität sind bei einem Experiment zu beachten? Wiederholung: Externe Validität bezieht sich auf die Verallgemeinbarkeit oder Übertragbarkeit der Untersuchungsergebnisse.Gute Interne Validität (klares Kausalverhältnis zwischen UV und AV) ist die notwendige Vorraussetzung für Externe Validität. Als im Rahmen der guten Externen Validität besonders gut verallgemeinbar gelten möglichst realistische (und also oft auch störanfällige) Bedingungen. Die vier Aspekte externer Validität sind: - Untersuchte Personen: Sind die Ergebnisse aus dieser Gruppe gut auf die Grundgesamtheit übertragbar - Treatment: Sind die Ergebnisse auf ähnliche Treatments übertragbar? - Messinstrumente: sind die gleichen Ergebnisse auch für andere Operationalisierungen zu erwarten? - Untersuchungsbedingungen: gelten die Ergebnisse auch für andere situative Bedingungen (kulturelle) Kontexte ?
- X.15.01 Wie kann man die externe Validität einer Untersuchung positiv beeinflussen? - Durch realitätsnahe Bedingungen, z.B. Feldforschung. - Cronbach und Shadish empfehlen die Generalisierbarkeit nicht nur argumentativ zu begründen, sondern durch Variation von einzelnen Faktoren innerhalb der Untersuchungsbedingungen auch empirisch zu untersuchen.
- X.15.01 Konstruktvalidität. Bei der Kontruktvalidität geht es darum, ob ein theoretisches Konstrukt durch die Untersuchungsmethoden auch ausreichend erfasst wird. Genaue Definition des Konstrukts und theoretische Vorarbeit sind nötig. Bilden unabhängige und abhängige Variable das Konstrukt valide ab ? Ist also eine gute Operationalisierung gelungen? Lebensnahme Operationalisierungsmethoden sind günstig. Ist die Konstruktvalidität zu gering, wird wiederum auch die Generalisierbarkeit bzw. Externe Validität von Testverfahren und Experimenten eingeschränkt.
- X.15.02. Wonach wird bei der Konstruktvalidität gefragt? Sind die theoretischen Konstrukte der Hypothese in der Untersuchung angemessen erfasst worden? Sind die richtigen Methoden eingesetzt worden um etwa ein Konstrukt wie Intelligenz zu erfassen ?
- X.16.01 Konfundierung Konfundierung ist die Vermischung von Drittvariablen (Störfaktoren, Störvariablen) mit der kontrolliert varierten, unabhängigen Variable.
- X.16.02. Welche 8 potentiellen Störfaktoren sind in Systematik nach Campell u. Stanley aufgelistet ? 1. Störfaktoren durch Auswahlverfahren (z.B. Freiwillig aber nicht repräsentativ. Wichtig ist es, Randomisierung, Parallelisierung ggf. Vortest durchzuführen) 2. Experimenteller Dropout 3. Testeffekte (z.B. Trainingseffekte durch wiederholteTests) 4. Veränderung der verwendeten Hilfsmittel (z.B. in Vor- u. Nachtests. Methodische Unterschiede bei Beobachtung u./ oder Auswertung. Andere Beobachter oder Geräte) 5. Reaktive Effekte (Bewußtsein der Teilnahme an einer Untersuchung, wie z.B. beim Hawthorne oder Placebo Effekt. Versuchsleitereffekt.) 6. Zwischenzeitliches Geschehen (Einflüsse von außen während des gesamten Unteruchungszeitraums, z.B. politische, gesellschaftliche auf eine Einstellung ) 7. Natürliche Änderungsprozesse / Reifung (biologisch/physiologische Vorgänge: Älterwerden, Konzentrationsverlust bei Hunger oder Anstrengung, Langeweile) 8. Statistische Regression (durch die sogenannte Regression zum Mittelwert bei der nachfolgenden Untersuchung, insbesondere bei Verwendung von Extremgruppen; Extremwerte im Vortest tendieren dazu sich etwas zu "normalisieren")
- X.16.02.b. In welchen beiden Bereichen ist beim Auswahlverfahren für eine Untersuchung mit Störfaktoren zu rechnen ? Störfaktor Typ 1) Auswahlverfahren. Es gibt hierbei zwei Bereiche, in denen Störfaktoren auftreten können: A) Bei der Rekrutierung der Probanden (Bedeutsam für die externe Validität, also für die Generalisierbarkeit der Ergebnisse, von einer vonGruppe Studenten der Mathematik kann ggf. schlecht auf Studenten der Sozialwissenschaften generalisiert werden) B) Bei der Zuordnung der Probanden zu den Untersuchungsgruppen (Randomisierung, Parallisierung, Vortest...)
- X.16.0.2.c Wie kann das Vier Gruppen Design von Solomon helfen, Störfaktoren des Typs 3 zu kontrollieren (Testeffekte) ? Testeffekte beeinträchtigen die interne Validität, wenn z.B. Lerneffekte durch einen vorangegangenen Vortest Wirkung zeigen. Um Vortest- Einflüsse als kontrollierte Variablen mit einzubeziehen, gibt es z.B. das Vier Gruppen Design von Salomon Eine Gruppe wird dem Treatment ausgesetzt, die andere nicht. Eine Gruppe wird vorgetestet, die andere nicht. Gruppe 1: Treatment mit Vortest (und Zeiteinflüsse) Gruppe 2 Kein Treatment mit Vortest (und Zeiteinflüsse) Gruppe 3 Treatment, kein Vortest (und Zeiteinflüsse) Gruppe 4 Kein Treatment, kein Vortest (allein Zeiteinflüsse) Durch Differenzenbildung lassen sich dabei die Einflussgrößen von Treatment, Vortest und Zeiteinflüssen bestimmen. Gruppe 1 und 3 werden verglichen, also jeweils ein Teil der Experimentalgruppe mit bzw. ohne Vortest. Gruppe 2 und 4 werden verglichen, also ein Teil der Kontrollgruppe mit Vortest mit einem Teil der Kontrollgruppe ohne Vortest. Ein durchschnittlicher Abweichungswert wird jeweils gebildet.
- X.16.02.d. Nenne ein Beispiel für Störfaktoren des Typs 4: Veränderungen der verwendeten Hilfsmittel. Wenn im Vortest ein anderes Messverfahren eingesetzt wird als im Nachtest, z.B. ein Interwiev anstatt eines Fragebogens. (dann stellt sich die Frage nach der Äquivalenz der Mittel)
- X.16.02.e Was ist der Hawthorne Effekt? Er bezeichnet den Effekt, den das Bewußtsein, an einer Untersuchung teilzunehmen, auf das Verhalten von Versuchspersonen haben kann: z.B. erhöhte Anstrengungsbereitschaft, Zeigen von sozial erwünschtem Verhalten, Selbstdarstellung). Innerhalb der Systematik von Störfaktoren gehört er zu Typ 5: Reaktive Effekte.
- X.16.02.f Wie können Erwartungseffekte die Untersuchungsergebnisse beeinflussen? Wie lassen sie sich reduzieren, kontrollieren oder ausschalten? Wenn Erwartungseffekte in Untersuchungs- und Kontrollgruppe gleichermaßen aufttreten, beeinflussen sie zwar ggf. die Ergebnisse jew. beider Untersuchnugsgruppen, aber nicht zwingend die Differenz der Effekte. (Die Differenz der Mittelwerte beider Gruppenn) Sehr wohl beeinflußt wird die Differenz (der Mittelwerte) aber, wenn es sich um gruppenspezifische Erwartungen handelt. Reduzieren lassen sich Erwartungseffekte durch die Standardisierung aller Untersuchnugsmethoden, insbes. des Verhaltens der Untersuchungsleiter. Kontrollieren/ Ausschalten lassen sich Erwartungseffekte durch: Doppelverblindung: Weder Versuchsleiter noch Probanden kennen die Fragestellung der Untersuchung, noch die Unterscheidung zwischen Versuchs- u. Kontrollgruppe.
- X.16.03. Untersuchungsdesign des Milgram Experiments Grobstruktur (noch nicht komplett) - Ziel / Fragestellung: Die Relevanz situativer Bedingeungen für Gehorsam empirisch zu prüfen. Inwieweit gehorchen Menschen in unterschiedlichen Situationen, auch wenn sie dann gegen ihr Gewissen und ihre Überzeugungen handeln müssen? Eigenschaften des Experiments - Systematisch weiter entwickelte Reihe von Untersuchungen - Mehrere Phasen - Als einzelne Experimente betrachtet, keine Kontroll- oder Vergleichsgruppe. - Jedoch Vergleich der Phasen untereinander möglich. - Untersuchungsgruppe zunächst rekrutiert aus Yale-Studenten, später aus der Bevölkerung per Zeitungsannonce. - VP in der Rolle eines "Lehrers" der dem "Schüler" auf Anweisung des Versuchsleiters (Schüler und Versuchsleiter sind speziell instruierte Schauspieler) zum "Lernen von Wortpaaren" unterschiedlich starke Stromstöße zur "Bestrafung" geben soll. - Abhängige Variablen: Durchschnittlich von den VP gegebener maximaler Schock (in Volt) Prozentsatz völlig gehorsamer VP (die den max. Schock von 450 Volt gaben). - Unabhängige Variablen VG 1 Getrennte Räume ohne verbales Feedback des "Schülers" VG 2 Getrennte Räume mit verbalem Feedback des "Schülers" VG 3 Gemeinsamer Raum ohne "Hand auf Metallplatte" VG 4 Gemeinsamer Raum mit "Hand auf Metallplatte" Insgesamt ( auch im späteren Verlauf) wurden variiert: räumliche Distanz zum Schüler (sichtbar / unsichtbar/nebeneinander Feedback des Schülers: Keines / Hämmern / Schreien Anwesenheit einer weiteren VP eines zweiten Versuchsleiters, eines Helfes, der die Stromschläge "ausführte" Rollentausch "Versuchsleiter" und "Schüler" zwei weitere -instruierte- VP die gegen die Befehle des Versuchsleiters protestieren. Versuchsleiter verläßt den Versuchsraum nach kurzer Zeit. Ergebnisse:
- X.17.01. Was ist ein Quasi Experiment? Es zielt ebenfalls darauf ab, die Wirkung von einer UV auf eine AV zu untersuchen, erfolgt aber charakteristischerweise in Untersuchungsanordnungen ohne Randomisierung. Oftmals z.B. als Evaluationsforschung im Auftrag von Institutionen und Organisationen. Die Settings sind meist natürlich (Feld)und finden z.B. in Betreiben schulen etc. statt. Das Treatment ist oftmals komplex besteht aus mehreren Komponenten über längere Zeitspannen.
-