Ereignisstichproben (Event sampling):
Registriert werden dasAuftreten, Dauer und/oder Intensität eines definierten Verhaltens: z.B.Lächeln während eines Gespräches; aggressives Verhalten währendder Schulpause --> slow motion modus Software INTERACT z.B:
Zeitstichproben (Time sampling):
Es wird registriert, ob und inwelcher Form oder Intensität innerhalb einer vorgegebenenZeitstichprobe definierte Verhaltensweisen auftreten: z.B. einespezifische Emotion oder Art und Intensität der Stimmung in 20Sekunden takt -> mit Strichlisten z.B.
Zeichensysteme
Registriert oder kodiert wird das Auftreten exakt definierter,möglichst konkreter Verhaltensweisen („Zeichen“), entweder imRahmen eines Event sampling oder Time sampling
Vor‐ und Nachteile:Zeichensysteme
Vor‐ und Nachteile:– Verhalten bzw. Verhaltensweisen sind präzise definiert--> Beobachtung ist daher relativ objektiv und zuverlässig– Beobachtung einzelner konkreter Verhaltensweisen ist jedoch nurdann sinnvoll, wenn sie übergeordneten inhaltlichen Konstrukten,die für eine diagnostische Fragestellung relevant sind, eindeutigzugeordnet werden könnenz.B. „Schlagen“ als Zeichen für Aggression, oder Bewegung einesGesichtsmuskels als Zeichen für eine Emotion im Rahmen der FACSKodierungnach Ekman & Friesen
Kategoriesysteme
• das innerhalb eines definierten Zeitraums gezeigteVerhalten (z.B. während einer Gruppendiskussion oderwährend der Schulpause) wird definierten Kategorienzugeordnet• Kategorien umfassen eine größere, nicht vollständigaufzählbare Menge an Verhaltensweisen und werdendurch einer allgemeine Umschreibung und durchAnkerbeispiele definiert• die Definition von Kategorien erfolgt theoriegeleitet und istauf die diagnostische Fragestellung bezogen
Kategoriesysteme – Vor‐ und Nachteile
• Komplexere Verhaltensmuster können kodiert werden• Offenheit für neue Elemente, die vorab nicht definiertwerden können • Kategorien sind im Unterschied zu Zeichen nicht vollständigpräzise definierbar, daher geringereBeobachterübereinstimmung durch subjektivenInterpretationsspielraum
Verhaltensbeurteilung
• Zusammenführung vieler einzelner Hinweisreize zu einerBeurteilung der Merkmalsausprägung• Das innerhalb eines definierten Zeitraums gezeigteVerhalten wird im Hinblick auf seine Ausprägung invorgegebenen Dimensionen eingeschätzt (z.B. Dominanz,Aggressivität, Teamorientierung) • mit Rating‐Skalen• dabei werden die Dimensionen meist nicht wie im Falleeiner Kategorie präzise definiert, d.h. es bleibt offen,welche einzelnen Verhaltensindikatoren die Beobachterihrem Urteil zugrunde legen• z.B. die herangezogenen Verhaltensindikatoren fürDominanz bleiben unbekannt
Objektivität Beobachtungsverfahren
Objektivität = Unabhängigkeit des Ergebnisses von derPerson die das Verfahren durchführt und auswertet– Inter‐Rater‐Übereinstimmung wird häufig unzutreffendals Inter‐Rater‐Reliabilität bezeichnet, ist jedoch ein Maßder Objektivität Cohens Kappa – bei nominalskalierten Daten Intraklassen‐Korrelation – bei intervallskaliertenDaten
Reliabilität Beobachtungsverfahren
• Reliabilität = betrifft das Beobachtungs‐ undBeurteilungsinstrument und nicht die Person, die esanwendet– Zeichensysteme – Konsistenzanalyse um zu prüfen ob dieaufgelisteten Verhaltensindikatoren ein einzigesMerkmal abbilden– Retest‐Methode – zu beachten, dass Verhaltensituationsabhängig und zeitlich häufig instabil istIn der Literatur wenig Angaben zu Reliabilität, sondernBeurteilerübereinstimmung
Inhaltsvalidität Beobachtungsverfahren
Zeichen bzw. Kategorien stellen eine repräsentative Stichprobe desintendierten Verhaltens dar
Fehlerquellen – Antworttendenzen
• Milde‐ und Strenge‐Effekte: Beobachter neigen entwedergenerell, in bestimmten Kontexten oder bei bestimmtenPersonen zu höherer Milde oder Strenge im Vergleich zuanderen Beobachtern• Zentrale Tendenz: Bevorzugung mittlerer Skalenpositionen->statistisch nachweisbar durch die eingeschränkte Varianzder Urteile eines Beobachters in Vergleich zu anderenBeobachtern• Tendenz zu Extremurteilen:-> statistisch nachweisbar durch die erhöhte Varianz derUrteile
Implizite Persönlichkeitstheorien (logische Fehler): BV
eswerden Zusammenhänge zwischen Merkmalen unterstellt– z.B. wird unterstellt, dass höfliche Menschen auch gewissenhaft sind
Positionseffekte (Primacy‐ & Recency‐Effekte):
der ersteoder letzte Eindruck beeinflussen das Urteil in stärkeremMaße als Beobachtungsphasen dazwischen -> am Anfang: Beobachter bildet schon schnell ein Gesamturteil --> am Ende: bei unklarem Gesamtbild: Beobachter stützt sich dann stark auf letzte Verhaltensweisen
Beobachterdrift:
die Genauigkeit der Beobachtung lässtentweder über die Beobachtungsphase nach oder sie nimmt zu lässt nach: Motivation sinkt oder Müdigkeit hebt an: bei ungenügender Schulung, lernt im Prozess hinzu
Reaktivität
Verhaltensveränderung durch die Anwesenheit oderunangemessenes Auftreten des Beobachters– ausgelöste Reaktivität kann stark zwischen Beobachtervariieren
Erwartungseffekte BV
die Beurteilung erfolgt auf der Grundlagedes erwarteten, nicht des tatsächlich gezeigten Verhaltens
Kontrast‐ und Ähnlichkeitseffekte: BV
die Beurteilung variiert inAbhängigkeit davon, ob die zu beobachtende Person als dereigenen Person ähnlich oder unähnlich wahrgenommen wird
Define diagnostisches Interview
Ist der Überbegriff für Methoden zur Erhebung von diagnostisch relevanten Informationen mittels Gespräch. Diagnostische Interviews unterscheiden sich durch den Grad ihrer Standartdisierung.
Formen des diagnostischen Interviews
– Das freie diagnostische Gespräch– Gespräche auf der Grundlage von Leitfäden– Strukturierte und standardisierte Gespräche
Funktionen des freien diagnostischen Gesprächs
• Einstieg in den diagnostischen Prozess und Aufklärung derKlienten• Aufbau einer diagnostischen Beziehung und diegegenseitige Abklärung von Zielen und Erwartungen• Deskription des Problems oder Sachverhaltes• Klärung der Vorgeschichte• Gewinnung von Hypothesen
Funktionen:Gespräche auf der Grundlage von
Leitfäden
• Systematische Gewinnung diagnostischer Informationenauf der Grundlage von Fragen, die im Hinblick auf einebestimmte Fragestellung vorbereitet wurden• Überprüfung von Hypothesen• Dabei besteht ausreichend Spielraum, um flexibel aufGesprächspartner und Gesprächssituation einzugehen
Ablauf Erstellung von Leitfäden
1. Präzisierung der Fragestellung: Was ist die diagnostischeAufgabe? Was soll erkundet werden?2. Erstellung der psychologischen Hypothesen: Von welchenAnnahmen wird ausgegangen? Von welchen Theorien undKonstrukten?3. Umsetzung in konkrete Fragen4. Zusammenstellung des Leitfadens: Welche Reihenfolge istpsychologisch sinnvoll?
Funktionen von strukturierten und standardisierten Gesprächen
• Selektionsentscheidungen (vor allem im Rahmen derEignungsdiagnostik)• Nosologische Klassifikation von psychischen Störungen inder Klinischen Psychologie und Psychiatrie• durch die Strukturierung und Standardisierung derGespräche ist gesichert, dass Gespräche mit allen Personenin vergleichbarer Form durchgeführt werden
Ablauf von strukturierten und standardisierten Gesprächen
• Ausgangspunkt ist ein Anforderungsprofil (empirische undtheoretische Ableitung der relevanten Merkmale)• Anforderungsmerkmale werden in Fragen umgesetzt• für jede Frage werden Auswertungsrichtlinien für dieAntworten erstellt• weitgehende Standardisierung im Hinblick auf dieDurchführung der Gespräche
Konstruktionsprinzipien Klinische Interviews
• die in den Klassifikationssystemen definierten Kriterien für eineStörung werden in einfache, verständliche Fragen umgesetzt• die Antworten auf die Fragen werden gleich kodiert• alle Störungsbereiche werden (wenn sinnvoll) erfragt• Sprungregeln geben an, wann Fragebereiche übersprungenwerden können
Objektivität von diagnostischen Gesprächen
ist abhängig von der Strukturiertheit undStandardisierung von Gesprächen; sie ist bei freienGesprächen grundsätzlich nicht gegeben ist bei Gesprächen generell vergleichsweise niedrig, daes sich um nicht vollständig standardisierbareInteraktionssituationen handelt (Einfluss u.a. vonSympathie, nonverbalem Verhalten, gegenseitigemVerständnis)
Reliabilität von diagnostischen Gesprächen kann erfasst
werden als..
Retest‐Reliabilität – Gespräch wird nach einembestimmten Zeitraum wiederholt Interrater‐Reliabilität – Ausmaß der Übereinstimmungzwischen mehreren Beurteilern, eher Maß derObjektivität (siehe Verhaltensbeobachtung)
Höhe der Reliabilität bei diagnostischen Interviews ist abhängig von...
der Strukturiertheit und Standardisierung des Gespräches der Qualität (Verständlichkeit, Präzision) der Fragen der Art der Protokollierung (Mitschrift oder Tonband) der Art des erfragten Sachverhaltes (Fakten oder Einstellungen)
Inhaltsvalidität Diagnostisches Gespräch
Repräsentiert die Frage den intendierten Inhaltsbereich?
Kriteriumsvalidität bei diagnostischen Gesprächen
• Kriteriumsvalidität der AussageStimmt die Aussage einer interviewten Person mit eineminternen oder externen Kriterium überein? • Kriteriumsvalidität der ErgebnisseStimmen die auf der Grundlage eines Gespräches getroffenenErgebnisse oder Entscheidungen mit einem internen oderexternen Kriterium überein?
Einflussfaktoren auf die Qualität
Interaktion zwischen Interviewer und interviewten Personen
• Gegenseitige Zuneigung oder Abneigung• Prozesse der Übertragung und Gegenübertragung• Verbale Konditionierung durch Mimik, Lächeln,Körperhaltung, Tonfall oder verbale Verstärker• Existenz einer „gemeinsamen Sprache“ (z.B. zweiMittelschichtangehörige oder Akademiker/innen)
Einflussfaktoren auf die Qualität
Auf Seiten der interviewten Personen
• Sprachverständnis• Kognitive Fähigkeiten (z.B. Abstraktionsfähigkeit,Fähigkeiten zur Verbalisierung)• Gedächtnis• Neigung zu sozial erwünschten Antworten• Neigung zur Simulation oder Dissimulation von Störungen
Einflussfaktoren auf die Qualität
Auf Seiten der Interviewer/in
• Wahrnehmungsfehler• Beurteilungsfehler (Halo‐Effekt, Milde‐ oder Strenge‐Effekt,Ähnlichkeits‐ und Kontrast‐Effekte)• Vorurteile• implizite Persönlichkeitstheorien (d.h. implizite Annahmenüber Zusammenhänge zwischenPersönlichkeitsmerkmalen)• einseitige Hypothesenbildungen
Strukturierte und standardisierte Interviews zur Diagnose nach
DSM IV
• die in den Klassifikationssystemen definierten Kriterien für eineStörung werden in einfache, verständliche Fragen umgesetzt• die Antworten auf die Fragen werden gleich kodiert• alle Störungsbereiche werden (wenn sinnvoll) erfragt• Sprungregeln geben an, wann Fragebereiche übersprungenwerden können
Terman‐Studie
– 1921/1922 wurden 1.400 Kinder mit dem Stanford‐Binet‐Staffeltestuntersucht– Kinder mit IQ höher 135 wurden über mehrere Jahre verfolgt– im Jahr 1960 waren von den männlichen Teilnehmern 47% inBerufsgruppen mit hoher kognitiver Beanspruchung (Rechtsanwälte,Richter, Ingenieure, Universitätsmitglieder, Naturwissenschaftler, Ärzte)– Es ist erstaunlich, „dass es möglich ist mit einem Intelligenztest, dessenBearbeitung weniger als zwei Stunden erfordert, so weit in die Zukunfteines Menschen zu schauen.“ (Schmidt‐Atzert & Amelang, 2012)
Seit Cattell (1949) werden Profile hinsichtlich folgender
drei Merkmalen beschrieben
– Profilhöhe– Profilstreuung– Profilgestalt
Testprofil
Graphische Darstellung standardisierter Skalenwerte fürdie Zusammenfassung von mehreren Testergebnissen(innerhalb eines Tests oder über mehrere Testverfahren)
ITC‐Richtlinie
„A competent test user will use tests appropriately,professionally, and in an ethical manner, paying due regard tothe needs and rights of those involved in the testing process,the reason for testing, and the broader context in which thetesting taked place.“• Qualitätsmerkmale diagnostischer Verfahren (Objektivität,Reliabilität, Validität, Qualität der Normierung,Testdokumentation) werden auch über die Verantwortungder diagnostizierenden Personen thematisiert• Adressiert hauptsächlich an die Fachvertreter
ITC‐Richtlinie
An wen gerichtet?
Guidelines for Quality Control in Scoring,Test Analysis, and Reporting of Test Scores – Kompetenzanforderungen andie Personen, die diagnostischeVerfahren einsetzen