Diagnostik (Fach) / Master (Lektion)
In dieser Lektion befinden sich 121 Karteikarten
Master
Diese Lektion wurde von PsychoStudyKo erstellt.
- (R/F) Die Kenntnis numerischer Kennwerte für Gütekriterien eines Tests reicht aus, um die Qualität psychodiagnostischer Verfahren bewerten zu können. Falsch
- (R/F) Nach der KTT hängt die Breite des Konfidenzintervalls auch vom beobachteten Wert ab. Falsch -> nach der IRT aber!
- (R/F) Beim Vergleich zwischen Testprofilen ist eine Korrektur für die Profilhöhe dann sinnvoll, wenn Niveauunterschiede z.B. auf unterschiedlichen Antwortstilen beruhen. Richtig
- (R/F) Nichtorthogonalität von Persönlichkeitsfaktoren beruht ausschließlich auf geteilten Methodeneffekten. Falsch
- (R/F) Der Reliable Change Index nach Jacobson & Traut berücksichtigt die Unrentabilität der Messungen. Richtig
- (R/F) Der Youden-Index ist ein Maß für die Testgüte eines kriteriumsorientierten Tests und kann einen Wert zwischen 0.5 und 1 annehmen. Falsch Das gilt für den AUC.
- Dichotomie Auswahlaufgaben in Persönlichkeitstests erhöhen das Risiko für Aquieszenz. Richtig Ja-Sage-Tendenz erhöht
- Was bedeutet Aquieszenz? Inhaltsunabhängige Zustimmungstendenz.
- (R/F) Nach dem einfachen Raschmodell unterscheiden sich Testitems lediglich in Schwierigkeit und Diskrimination. Falsch Nur Schwierigkeit Diskrimination im Birnbaum-Modell (2PL)
- (R/F) Differenzielle Itemfunktionen liegen vor, wenn Itemparameter zwischen Gruppen variieren, obwohl die Personenmerkmal gleich sind. Richtig
- (R/F) Höhere Trennschärfen werden i.d.R. in heterogenen Stichproben gefunden, niedrigere in homogenen Stichproben. Richtig
- (R/F) Für nach der IRT konstruierte Tests lassen sich alle KTT-Kennwerte ermitteln. Richtig
- (R/F) Verhaltensbeobachtungen und Experimente schließen sich gegenseitig aus. Falsch
- (R/F) Unsystematische Messfehler bei parallelen Persönlichkeitsbeurteilungen können durch aggregation reduziert werden. Richtig
- (R/F) Akkurate Persönlichkeitsurteile durch Dritte setzen Beurteilerkonsens voraus. Richtig
- (R/F) Bipolare Skalen haben einen Null- bzw. Bezugspunkt. Falsch
-
- (R/F) Response-Sets können durch Q-Sort-Techniken vermieden werden. Richtig
- (R/F) Nach der IRT kann die Messgenauigkeit für jedes Item eines Tests bestimmt werden. Richtig
- (R/F) Cohens Kappa als Maß der Beobachterübereinstimmungen berücksichtig die per Zufall erwartenden Übereinstimmung zwischen 2 oder mehr Beobachtern. Richtig
- (R/F) Bei einem IRT-konformen Test zeigen die Diskriminationsparameter, wo die Symptome auf dem latenten Merkmalskontinuum lokalisiert sind. Falsch Die Schwierigkeitsparameter tun das.
- (R/F) Die interne Konsistenz eines Tests kann durch Testverlängerung erhöht werden. Richtig
- (R/F) AUC ist ein Maß für die Testgüte eines kriteriumsorientierten Tests und kann einen Wert zwischen 0.5 und 1 annehmen. Richtig
- Was bedeutet AUC? Area Under Curve Teil der ROC (Receiver Operating Curve)
- (R/F) Korrelationen zwischen Persönlichkeitsfaktoren können auch auf geteilten Methodeneffekten beruhen. Richtig z.B. Big Five
- Bei Umpolung von Items bleibt die Faktorenstruktur eines Tests immer gleich. Falsch
- Nach welchen Kriterien kann ein adaptiver Test beendet werden? 1) Wenn eine bestimmte Anzahl von Items vorgelegt wurde. 2) Wenn der Standardfehler der Personenparameterschätzung hinreichend klein ist. 3) Wenn eine maximale Testzeit erreicht wurde. 4) Wenn alle im Tempool verfügbaren Items vorgelgt wurden.
- Der Cut-Off-Wert einer Depressivitäts-Skala wird wird erhöht. Wie ändern sich die Spezifität und die Sensitivität. Sensitivität (TP/TP+FN) wird schlechter. -> d.h. die Fähigkeit des Tests, tatsächlich Depressive als depressiv zu erkennen sinkt. (Anzahl der TP wird geringer, Anzahl der FN steigt, d.h. die ANzahl der als richtig eingestuften Depressiven an Gesamtzahl der positiv getesteten sinkt.) Spezifität (TN/TN+FN) steigt. -> d.h. die Fähigkeit des Tests, Gesunde als gesund zu erkennen, steigt. (Anzahl der FP sinkt Anzahl der als richtig eingestuften Nicht-Depressiven an der Gesamtzahl der als nicht-depressiv getesteten steigt.
- ROC: Nenn Sie 3 Vorteile der kriteriumsorientierten Vorhersage mithilfe sog. ROC-Analysen (verglichen mit anderen Indizes). 1) AUC (als Maß für Testgüte im Sinne von Trennschärfe) ist unabhängig von Basisrate. 2) AUC kann zwischen Stichproben / Populationen verglichen werden. 3) ROC ermöglicht die Ermittlung optimaler Cut-Off Werte.
- Wie kann man der Tendenz zur Mitte bei der Konstruktion von Ratingskalen vorbeugen? -Keine neutrale Mittelkategorie (bzw. gerade Anzahl wählbarer Skalenwerte) -Weiß-nicht-Kategorie
- Eine Iteminformationsfunktion zeigt . . . . . . wie gut ein Item zwischen Personen mit unterschiedlichen Merkmalausprägungen differenziert.
- Cronbachs Alpha setzt voraus, dass Items zumindest . . . sind. Ist diese Voraussetzung nicht erfüllt gibt Cronbachs Alpha die . . . wieder. - essentiell tau-äquivalent - untere Gruneze der Reliabilität
- Hohe Heterotrait-Monomethod-Korrelationen verweisen auf einen . . . Methodeneffekt.
-
- Prozentränge sind nicht intervallskaliert. Worauf muss man deswegen bei der Testwertinterpretation achten? Die Abstände zwischen Personen sind nicht interpretierbar.
- Worin unterscheiden sich Reliabilität und Iteminformationsfunktion nach IRT? - Reliabilität gilt für Gesamttests bzw. Gesamtskala - Iteminformationsfunktion (inkl. SE) variiert über Merkmalsspektrum
- Wie kann man die Stichprobeninvarianz für Itemparameter bestimmen? - Durch Prüfung des Modellfits bzw. der Kreuzvalidierung der Itemparameter über verschiedene Stichproben bzw. zwei Stichprobenhälften. - Itemparameter (Schwierigkeit und Diskriminationsfähigkeit) dürfen nicht zwischen Subgruppen variieren (sonst DIF) (- Ist Korrelation zwischen Parametern >.83: Hinweis auf Stichprobenunabhängigkeit der Parameter. ?)
- Wie kann man die Stichprobeninvarianz für Itemparameter bestimmen? - Durch Prüfung des Modellfits bzw. der Kreuzvalidierung der Itemparameter über verschiedene Stichproben bzw. zwei Stichprobenhälften. - Itemparameter dürfen nicht zwischen Subgruppen variieren (sonst DIF) (- Ist Korrelation zwischen Parametern >.83: Hinweis auf Stichprobenunabhängigkeit der Parameter. ?)
- Sie wollen nach der Theorie von Cleary die Testfairness von Studierfähigkeitstests für Männer und Frauen bestimmen. Wie gehen Sie vor? - Zusammenhang zwischen Prädiktoren (Studierfähigkeitstest auf der x-Achse) und Kriterium (Studienleistungen nach einem Jahr auf der y-Achse) jeweils für Männer und Frauen betrachten -> grafischer Zusammenhang/Regressionsfunktionen - Liegen die Funktionen für beide Subgruppen (Männer, Frauen) aufeinander ist der Test fair - Liegt bspw. die Regressionsgerade der Frauen über der der Männer, so unterschätzt der Studierfähigkeitstest die Studienleistung von Frauen (bei gleichem Testwert im Studierfähigkeitstest haben die Frauen bessere Studienleistungen/Noten nach einem Jahr) - In diesem Fall kann man die Testfairness durch Verwendung von gruppenspezifischen Normen erhöhen (ob das sinnvoll ist, ist eine andere Frage)
- Zwei Items korrelieren miteinander. Kann somit davon ausgegangen werden, dass keine lokal-stochastische Unabhängigkeit gilt? Begründen Sie ihre Antwort! - Nein, Items sollen sogar korrelieren, weil sie ja ein und dasselbe latente Merkmal erfassen sollen. Erst unter Konstanthaltung der Merkmalsausprägung (niedrige bzw. hohe Ausprägung), also auf den „lokalen“ Stufen des latenten Merkmals, dürfen die Items nicht korrelieren, um lokal-stochastisch unabhängig zu sein (dort müssen die Korrelationen „zusammenbrechen“).
- Sensitivität und Spezifität werden oft als Qualitätsmerkmale kriteriumsorientierter Tests präsentiert. Warum ist das problematisch? 1. Sensitivität und Spezifität lassen sich unabhängig von Basisrate interpretieren, dh. die Wahrscheinlichkeit, dass Krankheit als solche erkannt wird, ist in verschiedenen Populationen gleich.2. Positiver und negativer Vorhersagewert sind aber in Abhängigkeit von der Basisrate zu interpretieren, dh. dass eine Diagnose zutrifft oder nicht, hängt von der Basisrate (relativer Anteil der Krankheit an der Gesamtzahl an Personen) ab.
- Wie fair sind aus Sicht von KTT und IRT Vergleiche zwischen hoch- und niedrig intelligenten Personen, wenn ihre Leistungen auf der Basis adaptiver Tests ermittelt wurden? - KTT: unfairer interindividueller Vergleich! Beide Gruppen erscheinen gleich intelligent, obwohl die eine „intelligenter“ ist.- IRT: fairer interindividueller Vergleich möglich, da für IRT-konforme Items lokal stochastische Unabhängigkeit angenommen wird.
- Wie ist der Zusammenhang zwischen Schwierigkeit und Itemvarianz? Schwierigkeit sollte sich im mittleren Bereich befinden (50% der Stichprobe sollten diese gut lösen können). Solche Items erzeugen die meiste Varianz und damit die größte Trennschärfe.
- Was ist die Trennschärfe? Die Korrelation eines Items mit dem Gesamtergebnis eines Tests.
- Welchem Index in der CFA / EFA (?) entspricht die Trennschärfe? Faktorladung (konzeptuell vergleichbar, wenn auch nicht äquivalent) Confirmatory Factor Analysis / Explorative Factor Analysis
- Wie ist der Zusammenhang zwischen Trennschärfe und Schwierigkeit? Faustregel: - Items mit niedriger Trennschärfe ausschließen, selbst bei optimaler Schwierigkeit (mittlerer). - Items mit hoher Trennschärfe behalten, selbst wenn Schwierigkeit nicht optimal ist.
- Sie möchten die interne Konsistenz einer Persönlichkeitsbeurteilung durch informierte Beobachter steigern. Für welches Vorgehen entscheiden Sie sich? -Mittelung über drei Peers -Mittelung über Vater, Mutter, Partner -Mittelung über drei Peers (homogeneres Urteil wahrscheinlich, da aus selbem Kontext)
- Sie möchten die Reliabilität eines Speedtests erheben. Für welche Reliabilitätsschätzung entscheiden sie sich und warum? Paralleltest (Parallelität leicht herstellbar, einfach Rechenaufgabe gut vergleichbar) -keine interne Konsistenz (Warum?) -keine Retest (da Lerneffekte)
- In welchen Stichproben werden höhere / niedrigere Trennschärfen gefunden? höhere Trennschärfen -> heterogene Stichproben niedrigere Trennschärfen -> homogene Stichproben
- In welchen Stichproben werden höhere / niedrigere Schwierigkeiten gefunden? höhere Schwierigkeiten -> höhere Merkmalsausprägung niedrigere Schwierigkeiten -> niedrigere Merkmalsausprägung
- (R/F) Reliabilitätsschätzungen sind stichprobenabhängig. Richtig! (Konzept der Reliabilität gehört zur KTT, in IRT wird Testgüte bzw. Messgenauigkeit geschätzt)
- (R/F) Die Bestimmung des Konfidenzintervalls nach der Regressionshypothese beruht auf der Annahme, dass der beobachtete Wert eine gute Schätzung des wahren Werts einer Testperson ist. Falsch! Das würde auf die Äquivalenzhypothese zutreffen.
-