Diagnostik (Fach) / D.04. IRT (Lektion)

In dieser Lektion befinden sich 9 Karteikarten

IRT

Diese Lektion wurde von ybreitkopf erstellt.

Lektion lernen

Diese Lektion ist leider nicht zum lernen freigegeben.

  • Was versteht man unter Probalistische Theorien? Zusammenfassende Bezeichnung für eine Klasse „ähnlicher“ Modelle Rasch Modell (dichotome Antworten ja / nein ; richtig / falsch) Birnbaum-Modelle (dichotome Antworten) Partial-Credit-Model (mehrkategorielle Antworten) Linear Logistisches Test.Modell (LLTM)
  • Beschriebe die IRT Ausgangspunkt: Antworten von Perosnen auf Items Ziel: Rückschluss auf dahinterliegende Fähigkeit/Disposition, wenn nur die Antwort auf die Items vorliegen Um von einer Manifesten auf eine Latene Variable rückschließen zu können müssen 1. die Manifesten Variablen korrelieren 2. Die Itemantworten nur durch die eine Fähigkeit/ Disposition beeinfllusst sein Diese Vorraussetzungen nennt man Itemhomogenität: Kein anderes Merkmal hat systematischen EInfluss auf die Itemantworten Bedingung dafür: Lokale stochastische Unabhängigkeit
  • Was ist Lokale stochastische Unabhängigkeit? Wenn alle Items Manifestationen ein- und derselben latenten Dimension sein sollen, so werden ihre Korrelationen nur durch die Unterschiede in der latenten Dimension  hervorgerufen  Dies kann überprüft werden, indem man die latente Dimension auf einem bestimmten Wert (auf einer lokalen Stufe, z.B. ξv oder ξw) konstant hält. Sind die Items homogen, so muss sich nun die lokale stochastische Unabhängigkeit zeigen, welche darin besteht, dass die Korrelationen zwischen den Items auf diesen Stufen verschwinden. --> Itemhomogenität --> Überprüfung mit dem Multiplikationstheorem für unabhängige Ereignisse
  • beschreibe das Rasch-Modell Das Rasch-Modell beschreibt die Wahrscheinlichkeit, dass Testperson v, Item i löst in Abhängigkeit eines Personenparameters ξv und dem Itemschwierigkeitsparameter Probalistisch: Ob eine bestimmte Tp eine bestimmte Aufgabe löst oder nicht löst, hängt nur von ihrer Fähigkeit und der Schwierigkeit der Aufgabe ab, nicht aber davon, welche anderen Aufgaben sie bereits gelöst hat oder noch lösen wird.-- „lokal stochastisch unabhängig" Itemfunktionen verlaufen Paralell
  • was ist der Unterschied zwischen deterministischen und Pprobalistischen Modellen? Deterministische Modelle gehen davon aus, dass das Antwortverhalten der Probanden durch die Item- und Personenparameter vollständig bestimmt ist. Probabilistische Modelle hingegen nehmen eine stochastische Beziehung zwischen dem Antwortverhalten des Probanden und den Personen- und Itemparametern an.
  • Warum macht Adaptives Testen sinn? Um möglichst genau die Eigenschaftsausprägung vieler verschiedener Personen ermitteln zu können sollte ein Test viele Items enthalten, das führt zu Differenzierbarkeit in allen Bereichen der Eigenschaft. Das ist aber Belastend für die Testperson Also wird die Schwierigkeit der Items an die Personenfähigkeit angepasst daher werden Aufgaben gewählt die für die Person am meisten Informationen liefert: Die Items wo die Itemschwierigkeit nahe an dem Personenparameter leigt Items werden aufgrund vorher bearbeiteter Items der Person ausgewählt
  • Wie Funktioniert das branched-testing / Adaptives Testing ? Je nach Altersgruppe erhalten die Testteilnemer eine andere erste Aufgabengruppe (Block) je nach Anzhal  richtig gelöster Aufgaben bekommt die Testperon einen leichteren, gleichschweren oder Schwierigeren Block vorgelegt Es werden quasi die Aufgaben(-schwierigkeiten) an das Leistungsvermögen einer Person adaptiert Zur Konstruktion eines adaptiven Tests wird die Item-Response-Theorie (auch probabilistische Testtheorie) verwendet.
  • Beschriebe einen Adaptiven Test Adaptivers Itelligenz Diagnostikum (AID 19985, AID 2 neuere Auflage) Testart: Testbatterie für Kinder und Jugendliche zur Erfassung komplexer und basaler Kognitionen („Intelligenz"). Altersbereich: 6;0 bis 15;11 Jahre, u.U. darüber Testkonzept: Profilinterpretation in bezug auf möglichst viele Fähigkeiten(Verbale-aukustische und Manuelle-Visuelle Fähigkeiten) Testvorgabe:   Individualtest;  „adaptive" Aufgabenvorgabe im Sinne des „branched-testings" (für acht Untertests), optional konventionelle Testvorgabe Sonstige Diagnoseergebnisse: Qualitative Beurteilung des Arbeits- und Kontaktverhaltens, Screening in bezug auf ausgewählte Teilleistungsstörungen Einsatzmöglichkeit: Schulpsychologie, Berufs- und Bildungsberatung, Klinische Psychologie; diverse Fragestellungen bei fremdsprachigen Testpersonen
  • Wie siht es mit den Gütekriterien des AID aus? Skalierung: Die Verrechnung der Testleistungen zu Testwerten ist nachweislich „fair" im Sinne des Modells von Rasch Objektivität: Nachweisbare Testleitereffekte in zwei Untertests (Abweichungen um 4 T-Werte) Reliabilität:  Die innere Konsistenz ist auf Grund der Geltung des Modells von Rasch  gegeben , Split-half-Reliabilität für neun Untertests mehrheitlich zwischen .91 und .95 Stabilität nach vier Wochen bzw. nach mindestens einem Jahr mehrheitlich zwischen .83 und .95 bzw. zwischen .60 und .80 Validierung: Inhaltliche Gültigkeit auf Grund von Expertenbeurteilungen. Diskriminante Konstruktvalidität in Bezug auf zahlreiche Leistungstests, etliche Persönlichkeitsfragebogen und diverse Objektive Persönlichkeitstests sensu R.B. Cattell durchwegs gegeben.konvergente Konstruktvalidität) in Bezug auf ausgewählte spezielle Leistungstests (für den AID) mittelmäßig bis niedrig Normierung: Die Normen sind gültig (vgl. oben) Ökonomie: IAuf grund adaptiven Testens messen genau, trotz geringer Testlänge, Auswertungsaufwand mit Hilfe des  Computer-Auswertungsprogramms minimal, Nützlichkeit: In Bezug auf förderungsorientierte Diagnostik gegeben, speziell beim Screening von Teilleistungsstörungen; allgemein in Bezug auf fremdsprachige Testpersonen gegeben Zumutbarkeit:  Die energetisch-motivationale Beanspruchung ist vergleichsweise niedrig. Unverfälschbarkeit: Dass eine Testperson absichtlich und gezielt schlechte Leistungen erbringt, ist bei den üblichen Fragestellungen unwahrscheinlich Fairness: Auf Grund geschlechtsspezifischer Jahresnormen und der Verfügbarkeit schichtspezifischer Gruppenmittelwerte gegeben. Testdauer: Je nach Messgenauigkeit ca. 30 bis 75 Minuten, für drei Zusatztests weitere 10 bis 15 Minuten.