Testtheorie und Testkonstruktion (Fach) / Rasch Modell (Lektion)

In dieser Lektion befinden sich 16 Karteikarten

Item-Response-Theorie

Diese Lektion wurde von makem erstellt.

Lektion lernen

Diese Lektion ist leider nicht zum lernen freigegeben.

  • Warum Überprüfung der Modellkonformität? Obwohl Parameter bestmöglich geschätzt wurden, kann es sein, dass die zugrunde gelegte IC-Funktion nicht zu den Daten passt Modellkonformität ist gegeben, wenn empirisch beobachtete Daten zu Modellannahmen passen
  • Empirische Modellkontrollen Modell-Fit (z.B. Chi-Quadrat-Test) Stichprobe unterteilen und getrennte Parameterschätzungen vornehmen gefundene Parameter sollten sich nicht signifikant unterscheiden Graphischer Modelltest vs. statistischer Test (Likelihood-Quotienten-Test) Residuen (= Abweichung der geschätzten Daten von beobachteten Daten)
  • Graphischer Modelltest:  Je näher die geschätzten Itemparameter an der Hauptdiagonalen liegen, desto größer ist Konformität (Stichprobenunabhängigkeit und Raschhomogenität) Systematische Abweichungen weisen auf modellinkonforme Abweichungen zwischen den Itemparametern und den Teilungskriterium der Stichprobe hin Differential Item Functioning (DIF)
  • Likelihood-Quotienten-Test  Prüft mittels Signifikanztest die Unterschiedlichkeit der geteilten Stichprobe  Wenn nicht signifikant, dann unterscheiden sich die Parameterschätzungen in den Substichproben nicht  Identifikation einzelner nicht stichprobenunabhängiger Items ->  Aussonderung oder Überarbeitung betroffener Items und Überprüfung mittels neuer Daten
  • Was kann ein Grund für Mängel in der Modellkonformität sein? können auch aufgrund inadäquater Itembearbeitung einzelner Probanden auftreten z.B. Akquieszenz, Raten, Lügen, soziale Erwünschtheit, Sprachschwierigkeiten, mangelndes Instruktionsverständnis abberant response pattern
  • abberant response pattern Personen mit auffälligen Antwortmustern, denen bei Modellgültigkeit nur eine sehr geringe Auftretenswahrscheinlichkeit zukommt zb: leichtes Item mit nein und schweres Item mit ja - auffällig
  • Logitwert = Logarithmus aus Lösungswahrscheinlichkeit und Gegenwahrscheinlichkeit
  • Skala des 1PL-Modells Auch als Logit-Skala bezeichnet Metrik abhängig von IRT-Modell und Restriktionen bei Parameterschätzung • 0 = Mittelwert, Durchschnitt
  • Joint scale bei 1PL-Modell Lösungswahrscheinlichkeit hängt von Itemschwierigkeit und Personenparameter (Fähigkeit) ab, daher in einem Graph Schwierigkeit lese ich immer beim Wendepunkt ab
  • Zusammenfassung einer Interpretation der Raschskala nicht jedes Item liefert gleich viel Information über die Merkmalsausprägungen verschiedener Personen stärkster Zuwachs in der Lösungswahrscheinlichkeit eines Items, wenn Itemschwierigkeit und Merkmalsausprägung zusammenpassen also sind deutliche Unterschiede in den Lösungswahrscheinlichkeiten von Items zwischen zwei Personen nur dann zu finden, wenn Itemschwierigkeiten im Bereich der Fähigkeiten liegen Ziel ist es daher möglichst viele Items unterschiedlicher Schwierigkeit zu haben, um die Bandbreite an Schwierigkeiten abzudecken
  • Wie viel Information ein Item für die einzelnen Merkmalsausprägungen enthält, kann man berechnen: Multiplikation der Wahrscheinlichkeiten für Lösen und Nichtlösen eines Items bei gegebenem Personenparameter Maximal .25 (Nämlich dann, wenn Wahrscheinlichkeiten für Lösen und Nichtlösen gleich sind, .50)
  • 1 PL-Modell Einfachstes Modell der Latent- Trait-Modelle Itemschwierigkeitsparameter Alle Items haben die gleiche logistische IC-Funktion, die auf der x-Achse entsprechend ihrer Schwierigkeiten verschiedene Positionen aufweisen, aber gleich steil sind
  • Itemschwierigkeitsparameter Interpretation = Merkmalsausprägung, bei der die Lösungs-/Zustimmungswahrscheinlichkeit für Item i genau 0.5 beträgt Wendepunkt der Funktion Je stärker σ i von ξv übertroffen wird, desto größer Wahrscheinlichkeit P(xvi = 1) Je stärker ξv hinter σ i zurückbleibt, desto größer Wahrscheinlichkeit P(xvi = 0)
  • Differenz zwischen Personen- und Itemparamter = Lösungswahrscheinlichkeit Lineal an X-Achse bei Differenzwert anlegen und Schnittpunkt mit Graph ablesen
  • Welche Kennwerte/ Statistiken kann man sich anschauen um die Passung zwischen Modell und Daten zu beurteilen? Chisq (soll nicht signifikant werden, Residuen können betrachtet werden) graphischer Modelltest als erster Überblick, wenn nah an Hauptlinie: Stichprobenunabhängigkeit Likelihood-Quotienten-Test (Unterteilung der Stichproben und Testung gegeneinander) Person-Fit-Indizes: Aufdeckung inadäquater Item-Bearbeitung Residuen
  • Womit werden Parameterschätzungen vorgenommen? Schätzung der unbekannten Item- und Personenparameter mittels Maximum-Likelihood-Schätzung Systematische Wiederholung des Multiplikationstheorems für unabhängige Ereignisse, um nicht nur die Wahrscheinlichkeit einzelner Itemantworten zu ermitteln, sondern auch die aller Zellen in der Datenmatrix Sämtliche P(xvi) werden zeilen- und spaltenweise miteinander multipliziert