Psychologie (Subject) / Testtheorie (Lesson)
There are 134 cards in this lesson
Tutoriumsfolien
This lesson was created by FlorianMiehe.
- was ist die likelihood der daten? die wahrscheinlichkeit genau die vorliegenden daten (antwortmuster) zu erhalten
- wie berechnet man die likelihood der daten? wahrscheinlichkeiten aller zellen (item-antwortmuster) miteinander multiplizieren
- was ist die ausgangsbasis für die parameterschätzung (IRT) die likelihood
- was ist der unterschied zwischen der unconditional max. likelihood schätzung und er conditional max. likelihood schätzung? unconditional: ich habe keine info über personen und items, daher muss ich alle parameter schätzenconditional: reduzierte zahl zu schätzender parameter, da stichprobe bekannt (k -1) und weil personen geich viele ergebnisse gelöst haben bzw. items gleich häufig gelöst wurden (-> mehr info)
- wie berechne ich die item- einfachheit (IRT)? 1. anhand meiner testergebnisse erstelle ich eine gelöst/nichtgelöst matrix2. alle wahrscheinlichkeiten item x gelöst und y nicht miteinander multiplizieren3. alle wahrscheinlichkeiten item y gelöst und x nicht miteinander multiplizieren(usw. bis k items)4. die ergebnisse durcheinander teilen5. die k-te wurzel daraus ziehen
- was ist der unterschied zwischen dem z-test und dem löf test (IRT modelltestung) z-test: teilt VPn un zwei gruppen und vergleichen die normierten itemschwierigkeitsparameter-> ist die itemschwierigkeit in einer der gruppen signifikant unterschiedlich, gilt rasch für mindestens ein item nicht (Ist der Betrag des z-Werts größer als der kritische z-Wert, ist das Ergebnis signifikant und das Modell von Rasch gilt für dieses Item nicht.)löf-test: teilt die items in zwei gruppen und vergleicht die geschätzten personenparameter-> sonst gleiches vorgehen
- warum ist das rasch-modell (fast) vollständig stichprobenunabhängig? weil bei der berechnung der itemschwierigkeit zweier rasch-homogener items sich der personenparameter rauskürzt
- was ist das kommunalitätenproblem? durch den messfehler kann die korrelation eines items mit sich selbst nicht 1 sein (wie bei der parameterschätzung mithilfe der hauptkomponentenanalyse angenommen)
- was passiert in sehr homogenen stichproben mit den korrelationen und warum? gehen gegen 0weil in homogenen SP keine varianz des wahren werts auftritt, die varianz geht also ausschließlich auf den messfehler zurück
- was bedeutet eine hohe trennschärfe... für die items für die reliabilität des tests für die validität des tests? - bedeutet sie messen alle genau dasselbe d.h. trennen/diskriminieren personen scharf- führt bei mittelung mehrerer items zu hoher reliabilität- und daher zu eher geringer validität, da außenkriterium/konstrukt nicht zufriedenstellend abgebildet werden kann (items messen alle den gleichen teilaspekt)
- Wann sind dichotome fragen besonders informativ? wenn beide antworten gleich wahrscheinlich sind/ lösungswahrscheinlicheit 50%
- Was hat mehr information – item- oder personenparameter und warum? die itemparameter, weil wir mehr personen als items haben Informationsfunktion: I = p(+|v,i)+p(-|v,a)
- was ist die - und was sind die Vorraussetzungen der spezifischen objektivität? spezifische objektivität: ergebnisse sind unabhängig von stichprobe und itemauswahl-> vorraussetzungen: eindimensionalität, ICC dürfen nicht schneiden, lokal stochastische unabhängigkeit
- Was bedeutet es, wenn Sigma null normiert ist und ein item eine negative schwierigkeit hat (IRT) Items mit negativem vorzeichen sind leichter als der durchschnitt -> normierung macht items verschiedener tests vergleichbar
- Wie müssen die itemschwierigkeiten der gleichen items laut raschmodell in 2 gruppen sein? gleich, sonst nicht rasch-homogen -> z.b. grafische/z-test/löf-test modellkontrolle
- Ist das rasch modell völlig stichprobenunabhängig? = im modell ja, allerdings in der modell- prüfung nur bedingt, da bei besonders unfähigen, oder besonders fähigen stichproben in den extrembereichen weniger information steckt/ die itemschwierigkeit schwerer zu schätzen ist
-
- Wann spricht man im z-test nach fischer und scheiblechner von signifikanz? = ist der gefundene z-wert/ betrag größer als der kritische z-wert ist das ergebnis signfikant, also nicht rasch-homogen
- welche drei kennwerte werden bei der itemanalyse berechnet? Itemschwierigkeit/einfachheititemvarianzitemtrennschärfe (in welchem maß messen die items das gleiche)
- wie berechnet man die itemschwierigkeit bei dichotomen items? Im Falle dichotomer Items handelt es sich dabei um den Prozentsatz an Personen, die Item i gelöst haben. also: p = anzahl personen die das item gelöst haben / N
- wie führe ich eine Korrektur der Itemantworten für eine darauffolgende Berechnung der (korrigierten) Itemtrennschärfen durch? ich summiere die zeilen (also die scores der personen über alle items) = Xdann ziehe ich wieder die einzelnen scores von der berechneten summe ab(x1* = X - x1, x2*= X - x2, usw.) und trage die korrigierten scores in die tabelle einnatürlich für alle personen und items
- itemselektion - das verdünnungsparadoxon: wie berechne ich, welches item aus einem test entfernt werden kann, sodass die validität meines tests möglichst wenig beinträchtigt wird? Qi= vâl (Xi) / ri,t -> für alle items-> das item mit dem niedrigsten Qi wert fliegt raus
- was ist die kritik an der KTT? - axiome können nicht überprüft werden- kennwerte sind stichprobenabhängig- fairness ist fraglich
- was ist die vorraussetzung für stichprobenunabhängigkeit der item und personenparameterschätung bei der IRT lokal stochastische unabhängigkeit = In einer Gruppe von Personen mit gleicher Personenfähigkeit ist die Lösungswahrscheinlichkeit eines Items unabhängig davon, ob die Person das zuvor vorgegebene Item gelöst hat oder nicht.
- was zeichnet das guttmann modell aus? - itemhomogenität (items sprechen eine latente dimension an, wie bei rasch)- alles oder nichts itemcharakteristik (sprungfunktion)-> ab einer gewissen ausprägung der personenfähigkeit wird das item gelöst (davor nicht)-> lösungswahrscheinlichkeit also 0 oder 1- personenfähigkeit (x achse) ist gleich die itemschwierigkeit
- welche der folgenden lösungsmuster sind laut guttmann unzulässig? 0 0 0 0 1 1 1 0 0 1 1 0 1 0 1 0 1 1und1 0 1sind unzulässig
- was ist die kritik an der guttman skala? - keine ratewahrscheinlichkeit- konstante funktion bis zum sprung-> eher nicht praxisrelevant
- was zeichnet das latent distance modell von lazarsfeld aus? - noch sprungfunktion (ähnlich guttman)- aber zwei lösungswahrscheinlichkeiten- ICC können sich schneiden- daher theoretisch alle antwortmuster möglich (wenn alle itemösungswahrscheinlichkeiten größer als 0 sind)
- kritik am latent distance modell von lazarsfeld? Es ist eher unrealistisch, dass bei steigender Personenfähigkeit die Lösungswahrscheinlichkeit gleich bleibt
- welche funktion wählte rasch um die probleme von Guttman und lazarsfeld (latent distance) zu lösen? die logistische funktion-> die Itemcharakteristik ist abhängig von der Fähigkeit einer Person und der Itemschwierigkeit
- sind die ICC bei rasch monoton oder streng monoton? streng monoton
- wo kann man bei rasch ICCs die itemschwierigkeit ablesen? an der stelle wo die lösungswahrscheinlichkeit 0,5 ist auf der x-achse (personenfähigkeit xi)
- die drei forderungen des rasch modells? 1. eindimensionalität der items (alle müssne eine latente eigenschaft messen)2. spezifische objektivität: -die itemschwirigkeiten sind unabhängig von der stichprobe -die schätzung der personenparameter ist unabhängig von den items -ICC dürfen sich nicht schneiden3. erschöpfende statistik -anzahl der gelösten aufgaben = gesamte info über die fähigkeit der personen -anzahl der personen die items lösen = gesamte info über itemschwierigkeit
-
- wie berechne ich die ungewichtetetn faktorwerte/ skalenwerte? 1.ich prüfe auf welchen faktor die items hoch laden 2. ich summiere die scores der items, die auf einenn faktor hoch laden und auf den/die anderen weniger für jede person
- definiere die itemtrennschärfe? Die Trennschärfe ri,t eines Item i ist der korrelativeZusammenhang zwischen den Punkten, die von einer Person vim Item i und den Punkten die von Person v im Gesamttesterzielt werden. ri,t = r(Xi,v, Xv)