Diagnostik (Fach) / KTT (Lektion)

In dieser Lektion befinden sich 45 Karteikarten

klassische Testtheorie

Diese Lektion wurde von jonna erstellt.

Lektion lernen

  • Von wem ist die Theory of mental tests? Gulliksen
  • Was hat Spearman 1910 festgestellt? Dass Variablen mit Messfehlern niedriger korrelieren als Variablen mit Messfehlern :)
  • Die KTT ist eine ...-Theorie Messfehler
  • Die 3 Axiome & Zusatzannahmen, please 1. Existenaxiom (Es existiert ein wahrer Wert als Erwartungswert der Messung) 2. Verknüfungsaxiom (Jede Messung (beobachteter Wert) setzt sich additiv zusammen aus einem wahren Wert und einem Fehlerwert) (Der Erwartungswert der Fehler ist 0) 3. Unabhängigkeitsaxiom ( Die Fehlerwerte sind unabhängig von den wahren Werten des Tests) Zusatzannahmen: Die Fehlerwerte sind unabhängig von den wahren Werten eines anderen Tests. Die Fehlerwerte sind unabhängig von den Fehlerwerten eines anderen Tests.
  • Welches Axiom wird bei der Formel der Varianzzerlegung berücksichtigt? Das Unabhängigkeitsaxiom var(x) = var(t) + var(e)
  • Definition von Reliabilität Die Reliabilität gibt (in unquadrierter Form) den Anteil der Varianz der wahren Werte an der Gesamtvarianz an.  
  • Definition Standardmessfehler Der Standardmessfehler ist derjenige Anteil an der Streuung eines Tests, der zu Lasten seiner (gewöhnlich nicht perfekten, also "unvollständigen") Zuverlässigkeit geht. Also ein Maß für die Fehlerstreuung an der Streuung von Messwerten. > Die Streuung der beobachteten Werte um den entsprechenden wahren Wert einer Person, wenn wir die Testung oftmalig wiederholen können (ormalverteilung mit wahrem Wert als Mittelwert und set als Standardabweichung.
  • Was ist der Unterschied zwischen dem Erwartungsbereich für beobachtete Werte und dem Erwartungsbereich für den geschätzten wahren Wert? Beim Erwartungsbereich des geschätzten wahren Wertes wird die Regression zu Mitte berücksichtigt, indem die Reliabilität doppelt in die Formel aufgenommen wird. 
  • Was ist die Regression zur Mitte? Meint: Die wahren Werte der Probanden liegen im Schnitt etwas näher am Mittelwert der Testwerte, als die beobachteten Testwerte selbst. Wahre Werte regredieren zum Mittelwert der Verteilung.
  • Stichprobenfehler, qu'est-ce que c'est? Der Stichprobenfehler des Mittelwertes ist der Bereich, in dem die Mittelwerte zufällig gezogener Stichproben variieren.  Er wird mit zunehmendem Stichprobenumfang kleiner.
  • Wie errechnet man die Kritische Differenz, wenn man heterogene Reliabilitäten hat? Man berechnet den 'Standardmessfehler der Differenzen bei unterschiedlichen Reliabilitäten' und setzt ihn in die Formel der kritischen Differenz ein. 
  • Wann braucht man die Minderungskorrektur? Wenn man die Korrelation der wahren Werte zweier Tests schätzen möchte, deren Reliabilitäten bekannt sind.
  • Kritik an der klassischen Testtheorie - Man kann die Axiome nicht empirisch überprüfen - Es ist unplausibel anzunehmen, dass wahrer Wert und Fehlerwert nicht korrelieren, und es ist auch unplausibel anzunehmen, dass die Fehlerwerte zweier Tests nicht korrelieren - Aber nur wenn diese Annahmen stimmen, stimmt auch die Annahme, dass der Erwartungswert der Fehler bei Messwiederholungen 0 ist. (Verknüpfungsaxiom) - Die Übertragbarkeit von gruppenstatistischen Kennwerten auf den Einzelfall ist bedenklich, ... "denn mathematische Wahrscheinlichkeitsaussagen beziehen sich per Definition nicht auf Einzelfälle, sondern auf Klassen von Elementen" - KTT setzt Intervallskalenniveau voraus > ist aber oft nicht gegeben!!
  • Was ist mit der Stichprobenabhängigkeit der KTT gemeint? Die Reliabilität fällt je nach Stichproben höher oder niedriger aus > werden extreme Werte (Personen) nicht berücksichtigt, sinken die Korrelationen.
  • Populationsabhängigkeit Es gibt Subpopulationen mit unterschiedlichen Reliabilitäten und Validitäten > Je nach Subgruppenzugehörigkeit fallen die Berechnungen anders aus!
  • Welche vier Vorgehen gibt es zur Berechnung der Split-Half-Reliabilität? Was ist ihr Vorteil? Was ist das Problem? 1. Odd-Even 2. Halbierung in die erste und die zweite Testhälfte 3. Randomisierte Halbierung 4. Parallelisierung nach Schwierigkeit und Trennschärfe Vorteil: Instrumentelle Messgenauigkeit!! (Motivations-, Stimmung- und Aufmerksamkeitsschwankungen werden als Varianzquelle ausgeschlossen) geringer Aufwand. Problem: Die wahre Reliabilität wird unterschätzt, weil die Reliabilität mit der Anzahl der Items zunimmt.
  • 4 Tricks aus der Trickkiste zur Reliabilitätserhöhung 1. Testlänge erhöhen 2. Homogenere Items verwenden 3. Items mittleren Schwierigkeitsgrades wählen, wodurch sich deren Trennschärfe erhöht (dafür aber weniger Differenzierung in den Extrembereichen) 4. Objektivität steigern
  • Mittlere Schwierigkeit .8-.2 niedrig = z.B. .9 !!
  • mittlere Trennschärfe .3-.5 gut: .4-.7 noch brauchbar: .3-.39 nicht mehr brauchbar: kleiner als .3
  • mittlere Objektivität .6-.9
  • mittlere Reliabilität .8-.9
  • mittlere Validität (unkorrigiert) .4-.6
  • mittlere größe der Eichstichprobe 150-300
  • Bei der rationalen Testerstellungsmethode hängt die Güte des Tests ab von... der Güte der Definition des Konstrukts und dem Expertenwissen des Konstrukteurs
  • Vergleich der Konstruktionsstrategien: Durch welche Strategien erhält man Skalen mit hoher internen Konsistenz? induktiv und deduktiv-rational entwickelte Skalen
  • Welche Konstruktionsstrategie ist besonders Stichprobenanfällig? induktiv konstruierte Skalen
  • Wann sind zwei Tests parallel? Wenn sie den gleichen Mittelwert und die gleiche Standardabweichung haben und die Korrelationen gleich hoch sind.
  • Sind die Koeffizienten der Retest oder der Paralleltestreliabilität meist höher? Der Retestreliabiität
  • Was ist der beste Weg, die Parallelität von zwei Tests zu bestimmen? Konfirmatorische Faktorenanalyse
  • Was passiert, wenn man systematische Veränderungen der wahren Werte bei einem Retest hat? Ist nicht so schlimm, verändert die Reliabilität nicht unbedingt, weil ja z.B. alle gleich dazulernen
  • Was für Probleme gibt es bei Retests? - Unsystematische Veränderungen - Drop-Out - Verschieden große Erinnerungseffekte - Zeit zwischen Test und Retest: kurzes Intervall = Erinnerungseffekte groß; langes Intervall = andere unsystematische Veränderungen groß
  • Die Reliabilität kann über ... orientierte oder über ... orientierte Verfahren festgestellt werden über stabilitätsorientierte oder über konsistenzorientierte Verfahren
  • Nebengütekriterien Normierung, Vergleichbarkeit, Ökonomie, Nützlichkeit, Testfairness
  • Wovon hängt die Auswertungsobjektivität bei offenen Antwortformaten ab? Davon, wie detailliert die Auswertungskategorien im Testmanual beschrieben sind
  • mittlere Schwierigkeitskoeffizienten sind eine Bedingung für ... , was wiederum ... und ... begünstigt große Streuung der Itembeantwortungen, was wiederum hohe Trennschärfen der Items und die Homogenität der Skala 
  • Welche Art von Schwierigkeitskoeffizienten führen zu einer Verringerung von Trennschärfe und Homogenität? Extremeeeee
  • Wofür braucht man die Ratekorrektur? Wenn man die Itemschwierigkeit ausrechnen möchte und Zufallseinflüsse (also die Ratewahrscheinlichkeit) mit berücksichtigen muss und möchte
  • Was ist ein nomologisches Netzwerk? zu welcher Art von Reliabilität, Objektivität oder Validität gehört es? Konstruktvalidität, MTMM
  • Wann macht man eine Kreuzvalidierung? Bei der externalen (kriteriumsbezogenen) Testkonstruktion
  • Was setzt Cronbachs Alpha voraus? Was sagt es aus, was nicht? Tauäquivalente Items. Es beschreibt die untere Reliabilitätsgrenze, ist aber kein Maß für Itemhomogenität. Berücksichtigt mittlere Itembeziehungen und Anzahl der Items. Also: Ein hohes Alpha ist keine Garantie für Itemhomogenität oder Eindimensionalität!!
  • Was ist der Zusammenhang zwischen der Homogenität einer Stichprobe und der Reliabilität? Homogene Stichprobe führt zu höherer Reliabilität
  • Was bedeutet Exhaustivität? Alle Beobachtungen müssen zugeordnet werden können,  Stichwort: Auswahlaufgaben, gebundene Antwort, Wahl geeigneter Distraktoren, Disjunktheit
  • Nenne 5 Kennwerte der Testbeurteilung des Testkuratoriums der Föderation deutscher Psychologieverbände: Durchführungsobjektivität, Auswertungobjektivität Ansonsten die Nebengütekriterien: Fairness, (Nützlichkeit nicht), Normierung, Vergleichbarkeit, Ökonomie Theoretische Grundlage, Nachvollziehbarkeit, Transparenz, Bewährung, Änderungssensitivität, Akzeptanz
  • Was weißt du über tau-äquivalente Messungen? Bei tau-äquivalenten Messungen gilt, dass für jede Person der wahre Wert in beiden Messungen gleich ist – Allerdings besitzen die Messungen eine unterschiedliche Mess-genauigkeit, denn der Messfehler (Fehlervarianz) kann variieren => Anzuwenden bei unterschiedlichen Reliabilitäten  
  • verschiedene Itemarten in Persönlichkeitstests direkt vs indirekt hypothetisch vs biographiebazogen personalisiert vs depersonalisiert