Psychologie (Fach) / Quantitative Methoden der Datengewinnung und -analyse (Lektion)
In dieser Lektion befinden sich 55 Karteikarten
alles
Diese Lektion wurde von larissacassandra erstellt.
Diese Lektion ist leider nicht zum lernen freigegeben.
- Test- und Fragebogenkonstruktion: Ziele: ▪ Vermittlung des Ablaufes der Konstruktion eines psychometrischen Tests▪ Empfehlungen und Richtlinien für die Erstellung und Beurteilung von einzelnen Testaufgaben oder Fragen▪ Kompetenzen bei der Beurteilung der Qualität und Anwendungsbereiche von Verfahren entwickeln, auf Basis der Kenntnisse aus Testtheorie und Testkonstruktion
- Bestandteile der Konstruktion psychologischer Testverfahren? 1. Testplanung2. Konstruktionsstrategien für die Entwicklung von Tests und Fragebogen3. Aufgabentypen und Antwortformate für die Itemkonstruktion4. Fehlerquellen bei der Itembeantwortung5. Gesichtspunkte der Itemformulierung6. Erstellen einer vorläufigen Testversion7. Erprobung der vorläufigen Testversion
- Dimensionalität von Merkmalen: Unidimensional: Merkmal repräsentiert ein Konstrukt Multidimensional: Merkmal repräsentiert mindestens 2 Konstrukte
- Zeitliche Stabilität des Merkmals: Zeitlich stabile Merkmale (traits), z.B. Persönlichkeitsmerkmale Zeitlich veränderbare Merkmale (states), insb. aktuelle emotionale, kognitive und behaviorale Zustände
- Nennen Sie die 6 verschiedenen Testarten: Leistungstests -> Speed- und Powertests Persönlichkeitstests Objektive Persönlichkeitstests Projektive Verfahren Apparative Tests Nonreaktive Verfahren
- Testarten: Leistungstests: Kennzeichen: zu messende Konstrukte beziehen sich auf Dimensionen der kognitiven Leistungsfähigkeit Verfälschung nur nach unten ist möglich (faking bad) Motivation der Probanden zur Teilnahme an Untersuchung sollte gegeben sein, Anforderungen sind zu kommunizieren Testaufgaben sind meist so formuliert, dass die gegebenen Antworten als im logischen Sinn nur richtig oder falsch sein können Maximales Leistungsverhalten wird gefordert
- Testarten: Leistungstests: Anforderungen an Probanden: Lösung von Aufgaben oder Problemen Reproduktion von Wissen Unterbeweisstellen von Können Ausdauer oder Konzentrationsfähigkeit
- Testarten: Leistungstests: Speed- bzw. Geschwindigkeitstests: Einfache Aufgaben, die von allen Probanden gelöst werden können Differenzierung der Leistung anhand der Begrenzung der Bearbeitungszeit Maß ist Anzahl richtig beantworteter Aufgaben Anwendung insb. bei basalen kognitiven Fähigkeiten Beispieltest: Frankfurter Aufmerksamkeits-Inventar (FAIR-2; Moosbrugger & Oehlschlegel, 2011)
- Testarten: Leistungstests: Power- oder Niveautests: Schwierige Aufgaben, die auch bei unbegrenzter Zeitvorgabe theoretisch nicht von allen Teilnehmern richtig gelöst werden Differenzierung der Leistung anhand des Schwierigkeitsgrades der Aufgaben, die der Proband ohne Zeitbegrenzung bewältigen konnte Maß ist Anzahl richtig beantworteter Aufgaben Anwendung insb. bei Feststellung komplexerer kognitiver Fähigkeiten Beispieltest: Snijders-Oomen Non-verbaler Intelligenztest 2 ½– 7 (SON; Laschkowski et al., 2000)
- Testarten: Persönlichkeitstests: Kennzeichen: Kein maximales bzw. Leistungsverhalten, sondern typisches Verhalten soll erfasst werden Probanden geben Selbstauskunft Antworten des Probanden werden danach beurteilt, ob sie für das Vorhandensein einer hohen Ausprägung des interessierenden Merkmals sprechen oder nicht Verfälschung ist in beide Richtungen möglich (faking good/bad) Probanden können unterschiedliche motivationale Lagen bzgl. der Teilnahme an Untersuchung haben
- Vielzahl an „Persönlichkeitstests“ -> Tests und Fragebögen zur Erfassung von: (stabilen) Eigenschaften oder aktuellen Zuständen, Symptomen oder Verhaltensweisen Verfahren zur Messung von Motivation, Interessen, Meinungen und Einstellungen
- Persönlichkeits-Struktur-Tests bzw. Persönlichkeitstestsysteme: Erfassung von mehreren Persönlichkeitsdimensionen (multidimensionale Tests) Beispiele: Minnesota Multiphasic Personality Inventory 2 (MMPI-2; Hathaway et al., 2000)
- Testarten: Objektive Persönlichkeitstests: „Objektiv“ bezieht sich darauf, dass eine subjektive Verfälschung bei den Antworten, z. B. in Situationen der sozialen Erwünschtheit, ausgeschlossen oder erheblich reduziert ist Objektiv aufgrund geringer Augenscheinvalidität Erfassung eines Merkmals über das Verhalten in einer standardisierten Testsituation Beispiele: „Objektive Leistungsmotivations-Test“ (OLMT; Schmidt-Atzert, 2004)
- Testarten: Projektive Verfahren: Kennzeichen: Qualitative Erfassung der Gesamtpersönlichkeit Verwendung von mehrdeutigem Bildmaterial zu welchem der Proband Fragen beantwortet oder eine Geschichte schreibt Basiert auf Annahme, dass Proband unbewusste oder verdrängte Bewusstseinsinhalte in das Bildmaterial hineinprojiziert und dass Persönlichkeitsmerkmale auf diese Weise besser als durch direkte Befragung ermittelt werden könne Oft kritisiert wegen geringer psychometrischer Qualität Beispiel: Rorschach-Test (Rorschach, 1954)
- Testarten: Apparative Tests: Anwendung insb. zur Erhebung sensorischer und motorischer Merkmale, z.T. auch für kognitive Fähigkeiten Beispiel: sensumotorische Koordinationstests
- Testarten: Nonreaktive Verfahren: Nonreaktiv = alle Verfahren, mit denen Daten erhalten werden können, die keine direkte Begegnung mit dem Beobachteten voraussetzen. Beispiele: Tagebücher, Archivdaten
-
- Nennen Sie die 5 Konstruktionsstrategien für die Entwicklung von Tests und Fragebogen: 1) Intuitive Konstruktion2) Internale/Induktive Faktorenanalytische Konstruktion3) Rationale/Deduktive Konstruktion4) Externale/Kriteriumsorientierte Konstruktion5) Prototypenansatz
- Erläutern Sie die internale Konstruktionsstrategie bei der Entwicklung psychologischer Tests. Warum wird diese Strategie so bezeichnet? Welche anderen Bezeichnungen gibt es noch für diese Strategie und was sagen diese über die Strategie aus? Heißt auch: Induktive oder Faktorenanalytische Konstruktion Ist von dimensionsanalytischen Überlegungen geleitet; keine Orientierung an einer bestimmten Theorie oder Personengruppe Die Auswahl von Items und die Formulierung von Hypothesen über die zu erwartenden Dimensionen basieren auf theoretischen Vorannahmen aber die Dimensionalität des Tests wird letztlich empirisch bestimmt „Internal“, weil Skalenkonstruktion ausschließlich anhand der Item-Interkorrelationen erfolgt „induktiv“, weil jeweilige Konstrukte erst auf Basis dieser empirischen Klassifikationen definiert werden Ziel: Aufgabengruppen (= Subtests) zu finden bzw. zu konstruieren, die eine faktorenanalytische Einfachstruktur gewährleisten Bsp.: Intelligenz-Struktur-Test 2000 R
- Erläutern Sie die Rationale/Deduktive Konstruktion bei der Entwicklung psychologischer Tests. Nutzt Deduktionsmethode Grundlage ist eine elaborierte Theorie über die Differenziertheit von Personen hinsichtlich des interessierenden Merkmals/Konstrukts unterschiedliche Merkmalsausprägungen manifestieren sich in den Abstufungen der Häufigkeit oder Intensität des beobachtbaren Verhaltens ▪ Schritte der Konstruktion:1. Definition und Spezifikation des Konstrukts, u.a. Festlegung, in welchen Verhaltensweisen sich eine hohe Ausprägung des Merkmals und in welchen sich eine niedrige äußert2. Zu jedem der Teilbereiche oder Subkonstrukte werden Verhaltensindikatoren gesammelt und in Statement- oder Frageform gebracht3. Probanden werden Testitems vorgelegt4. Itemanalyse anhand konfirmatorischer Faktorenanalysen ▪ Testbeispiele: Intelligenztest nach Wechsler (1958)
- Erläutern Sie die Externale/Kriteriumsorientierte Konstruktion bei der Entwicklung psychologischer Tests. Items werden danach ausgewählt, ob sie zwischen Gruppen mit unterschiedlichen Ausprägungen in einem externalen Merkmal („Kriterium“) eindeutig differenzieren können (z.B. Gesunde vs. Depressive) Aufgabeninhalte in Situationen der rationalen Konstruktionsstrategien sind hier nicht von Interesse; entscheidend ist hier nur der Nutzen, der dann vorhanden ist, wenn die Items das gewählte Kriterium vorhersagen können Da nicht a priori theoriegeleitet vorgegangen wurde, bleibt das psychologisches Wirkgefüge, welches zur Differenzierungsfähigkeit der Items führte, unklar bzw. post-hoc spekulativ => inhaltliche Interpretation der Items bzw. die der Skala ist unzulässig Testbeispiel: Minnesota Multiphasic Personality Inventory (MMPI-2; Hathaway et al., 2000) Schritte der Konstruktion:1. Großen und inhaltlich breit gefächerten Itempool zusammenstellen und an Probanden erproben, die sich im Kriterium möglichst stark unterscheiden2. Empirische Auswahl jener Items, die diese Differenzierung bestmöglich leisten; ohne Belang ist, worauf diese Differenzierungsleistung (rational) basiert3. Zur Absicherung gegen rein situative Effekte sollte das Ergebnis der Itemauswahl möglichst auch an anderen Stichproben getestet werden (Kreuzvalidierung).
- Aufgaben mit freiem Antwortformat: Es sind keine Antwortalternativen vorgegeben; der Proband formuliert bzw. produziert die Antwort selbst Instruktion legt fest, wie auf das Item geantwortet werden soll, z.B. in dem eine Aussage zu machen ist, ein Text geschrieben werden soll oder eine Zeichnung anzufertigen ist Bei Auswertung müssen Antworten nach einem vorgefertigten Kategoriensystem „kodiert“ werden Unterscheidet zwischen Kurzaufsatzaufgaben und Ergänzungsaufgaben
- Aufgaben mit freiem Antwortformat – Kurzaufsatzaufgaben: Gegenstandsbestimmung und Vor & Nachteile: Proband soll auf Fragen in Form von Kurzaufsätzen bzw. Essays antworten Antwort kann nur aus einem Wort oder einem Satz bestehen ▪ Vorteile: Reproduktion von Wissen bzw. eine selbst erzeugte Antwort Zufällig richtige Antwort nicht möglich ▪ Nachteile: Zeitaufwändig bei Aufgabenbearbeitung und -auswertung Eingeschränkte Auswertungsobjektivität Benachteiligung von Probanden mit Formulierungsschwierigkeiten Erfordert sehr genaue Angaben des Testkonstrukteurs bzgl. der richtigen Kodierung von Antworten
- Aufgaben mit gebundenem Antwortformat – Ordnungsaufgaben mehrere Alternativen für mögliche Antworten sind vorgefertigt Sehr ökonomisch in der Auswertung, die mittels Schablonen oder computergestützt durch unmittelbare Antworteingabe des Probanden in den Computer erfolgt Meist höhere Auswertungsobjektivität als bei freiem Antwortformat Bearbeitung, in dem die einzelnen Bestandteile der Aufgabe umgeordnet oder einander so zugeordnet werden müssen, dass eine inhaltlich passende Ordnung entsteht Zwei Arten von Ordnungsaufgaben: Zuordnungs- und Umordnungsaufgaben
- Aufgaben mit gebundenem Antwortformat - Ordnungsaufgaben - Zuordnungsaufgaben - Vorteile & Nachteile: ▪ Vorteile:- einfach, ökonomisch, objektiv, platzsparend- Für Wissens- und Kenntnisprüfungen gut geeignet- Raten ist geringes Problem, falls Zahl der Antwortalternativen die Zahl der Fragen übersteigt ▪ Nachteile:- Keine Reproduktions-, sondern nur Wiedererkennungsleistung erforderlich- Antwortalternativen sind nicht unabhängig voneinander => um Ratewahrscheinlichkeit gering zu halten, sollten zusätzliche nicht zuordenbare Antwortalternativen hinzugefügt werden (Distraktoren)
- Aufgaben mit gebundenem Antwortformat - Ordnungsaufgaben - Umordnungsaufgaben: Verlangt Umsortieren von Worten, Satzteilen, Zahlen, Bildern oder Gegenständen zu einer sinnvollen oder logischen Reihenfolge Häufig bei sog. Materialbearbeitungstests angewendet, z.B. im HAWIK Vorteile: Teilnehmer, welche beim Lesen beeinträchtigt sind können diese Aufgaben gut lösen Schlussfolgerndes Denken, Ursache- Wirkungs-Zusammenhange oder Abstraktionsfähigkeiten können mit diesem Aufgabentyp gut überprüft werden Des Weiteren sind sie ebenfalls einfach und objektiv Nachteile: Hoher Materialverbrauch Für Gruppentestungen wenig geeignet
- Aufgaben mit gebundenem Antwortformat – Auswahlaufgaben Proband aufgefordert aus mehreren vorgegebenen Antwortalternativen die richtige bzw. zutreffende Antwort zu identifizieren Konstruktionsentscheidungen: Bei Leistungstests: Wahl geeigneter Distraktoren, Disjunktheit der Antwortmöglichkeiten Bei Persönlichkeitstests: Wahl geeigneter Distraktoren, Disjunktheit der Antwortmöglichkeiten, Exhaustivität der Antwortalternativen Im Leistungskontext sind es die am meisten eingesetzten Aufgaben
- Aufgaben mit gebundenem Antwortformat – Auswahlaufgaben: Dichotome Aufgaben: Nur zwei Antwortalternativen sind vorgegeben Oft werden auch statt zwei Antwortvarianten nur ein Statement angeboten, welches dann mit „ja/nein“, „stimmt/stimmt nicht“ oder „richtig/falsch“ zu beantworten ist (daher auch Richtig-Falsch-Aufgaben genannt) Vorteile:▪ einfach und ökonomisch▪ geringer Zeitaufwand▪ geringer Papierverbrauch▪ leicht verständlich für Probanden Nachteile:▪ 50% Ratewahrscheinlichkeit▪ nur Wiedererkennungsleistung gefragt▪ erhöhte Zustimmungstendenz▪ teilw. Schwierigkeiten bei der Formulierung des Aufgabenstamms
- Aufgaben mit gebundenem Antwortformat – Auswahlaufgaben: Mehrfachwahlaufgaben: Bei Leistungstests ist diejenige Alternative auszuwählen, die richtig ist; bei Persönlichkeitstests jene, die individuell (am ehesten) zutrifft Bei Konstruktion von Antwortalternativen im Persönlichkeits- und Einstellungsbereich ist auf der Exhaustivität der Alternativen besonders zu achten Falls Exhaustivität nicht vorliegt, können Probanden mit einer entsprechenden Instruktion veranlasst werden, jene Antwort zu wählen, die am ehesten auf sie zutreffen => „Forced Choice“-Antwortformat „klassische“ Mehrfachwahlaufgaben haben eine richtige Lösung In Leistungstests werden Antwortformate mit mehreren richtigen Lösungen angegeben => zwei mögliche Instruktionen: Instruktion mit oder ohne Information über Anzahl richtiger Lösungen Beide Instruktionen verringern die Ratewahrscheinlichkeit Vorteile:▪ Einfach, ökonomisch und objektiv bei Durchführung und Auswertung▪ Bei Leistungstest ist Ratewahrscheinlichkeit stark verringert, insb. wenn Probanden Anzahl richtiger Antworten identifizieren müssen Nachteile:▪ Lediglich Wiedererkennungsleistung abgefragt, daher nicht für alle Konstrukte (z.B. Kreativität) geeignet▪ Mglw. Verzerrungen, wenn Distraktoren Mängel aufweisen (z.B. bei ungleich attraktiven Antwortalternativen) oder wenn Aufgabe selbst Hinweise auf Problemlösung beinhaltet
- Aufgaben mit gebundenem Antwortformat – Beurteilungsaufgaben Einsatz in Persönlichkeitstests mit Abfrage des Grades der Zustimmung oder Ablehnung zu einer im Aufgabenstamm vorgelegten Aussage Aussage = Indikator für Ausprägungen des untersuchten Persönlichkeitsmerkmal Antwortformate: Kontinuierliche Analogskala: ermöglichen besonders feine Differenzierung der Beurteilung Diskret gestufte Ratingskala: mind. zwei, i.d.R. mehr als zwei graduell abgestufte Beurteilungskategorien Antwortkategorien meist nicht aufgabenspezifisch formuliert, sondern in einheitlicher Form für den gesamten Test
- Bei Konstruktion der Antwortskala sind folgende Aspekte zu beachten: 1. Skalenstufen verwenden oder nicht?2. Antwortskala uni- oder bipolar?3. Bezeichnung der Skalenpunkte4. Skala mit oder ohne neutraler Mittelkategorie?5. Einsatz einer „Weiß nicht“-Kategorie?6. Einsatz von asymmetrischen Beurteilungsskalen?
- Aufgaben mit gebundenem Antwortformat – Beurteilungsaufgaben: Konstruktion der Antwortskala: Skalenstufen verwenden oder nicht? Wenn Skalenstufen verwendet werden, muss entschieden werden wie viele Stufen zugelassen werden => hängt vom Grad der Differenziertheit des Urteils ab, das von Probanden erwartet werden kannUnterscheidung: Kontinuierliche Analogskala, z.B. visuelle Analogskala zunehmend häufiger eingesetzt aufgrund Zunahme von computergestützter Erhebungen; insgesamt aber noch selten verwendet, da individuelle Urteile meist nicht so ausdifferenziert Diskret gestufter Ratingskala für mehr als sieben Skalenstufen ist meist kein Informationsgewinn in den individuellen Urteilsdifferenzierungen zu erwarten Bei sehr vielen numerischen Stufen (z.B. 100) wählen Probanden meist jene Stufen, die durch 10 bzw. 5 teilbar sind bei Wahl der Anzahl der Stufen sind Antworttendenzen zu beachten, z.B. bei wenigen Antwortkategorien ist Tendenz zum extremen Urteil weniger ausgeprägt
- Aufgaben mit gebundenem Antwortformat – Beurteilungsaufgaben: Konstruktion der Antwortskala: Antwortskala uni- oder bipolar? Unipolar:• hat einen Bezugspunkt („Nullpunkt“), der geringste Zustimmung (bzw. Ablehnung) kennzeichnet, sowie einen positiven (bzw. negativen) Pol, der stärkste Zustimmung (bzw. Ablehnung) markiert• Intensität, Häufigkeit oder Grad der Zustimmung (bzw. Ablehnung) steigt nur in eine RichtungBipolar:• Zustimmungs-/Ablehnungsbereich reicht von positivem zu negativem Pol• Entscheidung hängt von Iteminhalt bzw. vom zu erfassenden Merkmal ab
-
- Aufgaben mit gebundenem Antwortformat – Beurteilungsaufgaben: Konstruktion der Antwortskala: Bezeichnung der Skalenpunkte/stufen: Unterscheidungen:• numerische Ratingskala• verbale Ratingskala• Optische Skalen und Symbolskalen• Kombination aus obigen Skalen
- Aufgaben mit gebundenem Antwortformat – Beurteilungsaufgaben: Konstruktion der Antwortskala: Skala mit oder ohne neutraler Mittelkategorie? neutrale mittlere Kategorie wird von Probanden nicht nur instruktionsgemäß, d. h. im Sinne einer mittleren Merkmalsausprägung, benutzt dient häufig als Ausweichoption, wenn der Proband den angegebenen Wortlaut als unpassend beurteilt, die Frage nicht versteht, die Antwort verweigert oder aber diese nicht kennt besonders motivierte Probanden meiden die Mittelkategorie D.h. erhebliche Gefahr der Konfundierung des interessierenden Konstrukts mit einem konstruktfremden Antwortverhalten => Validitätsprobleme
- Aufgaben mit gebundenem Antwortformat – Beurteilungsaufgaben: Konstruktion der Antwortskala: Einsatz einer „Weiß nicht“-Kategorie? „Weiß nicht“- oder „Kann ich nicht beantworten“-Kategorie eine zusätzliche „Weiß-nicht“-Antwortkategorie kann Problem der konstruktfremden Verwendung der neutralen Mittelkategorie verringern; neutrale Mittelkategorie kann nun ihre Funktion als Mitte der Beurteilungsskala erfüllen Verwendung, wenn anzunehmen ist, dass Probanden zum Untersuchungsgegenstand keine Meinung haben, ihn nicht kennen, die Antwort nicht wissen oder die Frage sprachlich nicht verstehen könnten
- Aufgaben mit gebundenem Antwortformat – Beurteilungsaufgaben: Konstruktion der Antwortskala: Einsatz von asymmetrischen Beurteilungsskalen? Asymmetrische Skalen werden eingesetzt, wenn damit zu rechnen ist, dass Probanden ein vollständig symmetrisches Antwortspektrum nicht nutzen werden Selten in psychologischen Tests verwendet häufiger Einsatz in Marktforschung und Kundenzufriedenheitsforschung Eine Variante asymmetrischer Skalen sind itemspezifische Antwortformat: Kategorien werden asymmetrisch an Iteminhalten angepasst Anzahl der Antwortkategorien unterscheiden sich von Item zu Item Häufig bei demographischen Daten angewendet Vorteil: Antworttendenzen sollten kaum auftreten
- Aufgaben mit gebundenem Antwortformat – Beurteilungsaufgaben: Vor & Nachteile: Vorteile von Beurteilungsaufgaben:-In Praxis leicht zu handhaben, ökonomisch bzgl. Materialverbrauch und Auswertungszeit-Bei Einsatz gleicher Antwortkategorien wird Proband kognitiv entlastet und Bearbeitungsdauer sinktNachteile:-numerische Anker erwecken Anschein eines Intervallskalenniveaus der Antworten und erleichtern Anwendung von statistischen Auswertungsverfahren, aber streng genommen handelt es sich aber um ordinale Skalen, dies kann bei Interpretation der Ergebnisse zu messmethodischen Problemen führen.
- Aufgaben mit atypischem Antwortformat ▪ Häufigstes Format = Aussagen-Vergleichs-Aufgabe => insbesondere zur Prüfung des logischen Urteilsvermögens eingesetzt
- Fehlerquellen bei der Itembeantwortung: ▪ Bezieht sich nicht auf zufällige, sondern auf systematische Fehler => sie erzeugen konstruktirrelevante Varianz vor allem in Ratingdaten und mindern auf diese Weise die Validität der Items ▪ Systematische Fehler aufgrund von - Sozialer Erwünschtheit - Antworttendenzen und - deren Interaktion ▪ Kognitive Prozesse bei Itembeantwortungen werden bei Testkonstruktionen häufig zu wenig beachtet
- Kognitive Stadien bei der Aufgabenbearbeitung: (Podsakoff, MacKenzie, Lee & Podsakoff, 2003) Verständnis Abruf Urteil Antwortwahl Antwortabgabe
- Optimizing-Satisficing-Modell (Krosnick, 1999): Liefert Erklärungen für systematische Fehlerquellen (z.B. soziale Erwünschtheit, Tendenz zur Mitte, Akquieszenz) Es werden ähnliche kognitive Prozesse wie bei Podsakoff et al. (2003) angenommen Es wird angenommen, dass sich Probanden einer von zwei Motivgruppen zuordnen lassen => Optimizing vs. Satisficing Optimizing• Motivation aufgrund eines positiven Grundes => veranlasst zu gründlicher Bearbeitung• Gründe = Selbstbild des Probanden, zwischenmenschliche Verantwortung, Altruismus, Wille einem Unternehmen, dem Staat etc. zu helfen, Belohnung Satisficing• engl. zusammengezogen aus satisfying und sufficing• Motivation ist eher beiläufig oder aufgrund Verpflichtung➢ führt zu Dilemma-Situation: geringe Anstrengungsbereitschaft vs. kognitiv anspruchsvolle Aufgaben ➢ Zwei Bewältigungsstrategien:• schwaches Satisficing: einzelne kognitive Prozesse werden nur oberflächlich durchgeführt• starkes Satisficing: Prozesse des Abrufens und Urteilens verschmelzen => Pbd gibt eine Antwort, welche ihm gegenüber Testleiter oder Testintention nur mehr formal am besten passt, unabhängig von tatsächlichen Einstellungen, Meinungen etc..
- Systematische Fehlerquellen: Soziale Erwünschtheit: Tendenz Antwortverhalten so auszurichten, dass man möglichst positiv bewertet wird Zwei Aspekte:-Selbsttäuschung (Self-deceptive enhancement)-Fremdtäuschung (Impression management)▪ Soziale Erwünschtheit ist bei mündlichen Interviews stärker als bei schriftlichen Befragungen▪ Einfluss sozial erwünschten Antwortverhalten kann man versuchen zu reduzieren, z.B. durch: Aufklärung über den Untersuchungsgegenstand & Zusicherung der Anonymität der Probanden ▪ Einfluss sozial erwünschten Antwortverhaltens kann man versuchen zu kontrollieren, in dem die Neigung, sich sozial erwünscht zu verhalten, erfasst wird und diese Variable als Kontrollvariable in eigenen Analysen berücksichtigt wird=> Pbd beantwortet Items zu sozial negativen Verhaltensweisen, die aber weit verbreitet sind=> Anzahl verneinter Items spiegelt Stärke der Neigung zu sozialerwünschtem Antwortverhalten wider
- Systematische Fehlerquellen: Tendenz zur Mitte: Bevorzugung der mittleren (neutralen) Antwortkategorie Ursachen:▪ Subjektiv unzureichendes Wissen▪ Einschätzung, dass Antwortalternativen zur Beurteilung nicht geeignet sindAuswirkungen: verringerte Itemvarianz und VerzerrungenMögliche Lösungen:▪ Keine Mittelkategorie anbieten▪ Keine zu extremen sprachlichen Bezeichnungen für die Pole der Beurteilungsskalen verwenden▪ Anbieten einer „Weiß nicht“-Kategorie ▪ Tendenz zu extremen Urteilen ist seltener zu beobachten
- Systematische Fehlerquellen: Akquieszenz (Zustimmungstendenz): Tendenz, den vorgegebenen Fragen oder Aussagen unabhängig vom Inhalt zuzustimmen Studien zeigten, dass Pbd im Durchschnitt lieber einem positiv formulierten Statement zustimmen, als dasselbe Statement, wenn es negativ formuliert ist, abzulehnen Wenn Pbd bei dichotomen Aufgaben rät, dann werden häufiger die Option „richtig“ gewählt als Option „falsch“ (Krosnick, 1999) Akquieszenz tritt häufiger auf: ▪ bei Ja/Nein-Aufgaben▪ bei Personen mit begrenzten kognitiven Fähigkeiten▪ bei schwierigeren Aufgaben▪ bei Personen im Zustand der Müdigkeit▪ in unpersönlichen Befragungen (z. B. Telefoninterviews) als in faceto-face Befragungen Um Akquieszenz aufzudecken, werden Items invertiert, d.h. ein und dasselbe Item wird in seiner positiven als auch einer negativen Formulierung dargeboten Die Itempolung kann aber zu einer artifiziellen Faktorenstruktur führen, d.h. trotz eines homogenen, eindimensionalen Merkmals tendieren positiv und negativ gepolte Items dazu, zwei verschiedene Faktoren zu bilden (Greenberger et al., 2003) Effekte der Itempolung hängen von Alter und Bildungsniveau ab (Krebs & Matschinger, 1993)
- Nennen Sie die 5 Gesichtspunkte der Itemformulierung: • Itemarten• Sprachliche Verständlichkeit• Eindeutiger Iteminhalt• Varianz des Antwortverhaltens und Itemschwierigkeit• Weitere Aspekte
- Nennen Sie die 6 verschiedenen Itemarten: ▪ Direktes vs. indirektes Ansprechen des interessierenden Merkmals▪ Hypothetische vs. Biographiebezogene Itemformulierung▪ Konkrete vs. abstrakte Items▪ Personalisierte vs. depersonalisierte Items▪ Stimulusqualität/-intensität▪ Aufgabeninhalte
- Itemarten: Direktes vs. indirektes Ansprechen ▪ Beispiel: Ängstlichkeit:Direkt: „Sind Sie ängstlich?“Indirekt: „Fühlen Sie sich unsicher, wenn Sie nachts allein auf der Straße sind?“ ▪ Direkt: interindividuelle Varianz bzgl. Interpretation des Iteminhaltes möglich, d.h. das Merkmal könnte unterschiedlich aufgefasst werden▪ Indirekt: gut gewählte Verhaltensindikatoren erleichtern Interpretation des interessierenden Konstrukts
- Itemarten: Hypothetische vs. biographiebez. Items ▪ Beispiel:Hypothetisch: „Stellen Sie sich vor, es gäbe immer wieder Konflikte zwischen den Mitarbeitern in ihrer Abteilung. Was würden Sie dagegen unternehmen?“Biographiebezogen: „Wie haben Sie sich bei der letzten Auseinandersetzung mit einem Kollegen/Kommilitonen verhalten?“ ▪ Hypothetisch: Gefahr von Fehleinschätzungen▪ Biographiebezogen: ist zuverlässiger; enthält neben dem interessierenden Einfluss des untersuchten Merkmals der Person immer auch eine Situationskomponente („situational judgment“); Fragen sind bzgl. interindividuell passender Situationen beschränkt und nicht immer für jeweiligen Geltungsbereich sinnvoll
- Itemarten: Konkrete vs. abstrakte Items ▪ Beispiel:Konkret: „Wie verhalten Sie sich, wenn Sie einen Streit zwischen Kollegen schlichten müssen?“Abstrakt: „Wie belastend schätzen Sie die Arbeit in einem konfliktreichen Arbeitsumfeld ein?“ ▪ Konkret: informieren meist besser über situationale Bedingungen▪ Abstrakt: lassen Interpretationsspielräume zu, die Gefahr von Fehleinschätzungen beinhalten
- Itemarten: Personalisierte vs. Depersonal. Items ▪ Beispiel:Personalisiert: „Benutzen Sie Kondome?“Depersonalisiert: „Sollte man Kondome benutzen?“ ▪ Personalisiert: liefern sehr zuverlässige Informationen, ggfs. Nicht ehrlich beantwortet▪ Depersonalisiert: Gefahr, dass nur allgemeine, nichtssagende Antworten gegeben werden oder ein nichtinteressierendes Merkmal erfasst wird
-