psychologische diagnostik (Subject) / diagnostik (Lesson)

There are 165 cards in this lesson

VO Uni Wien SS18

This lesson was created by LauraFichti.

Learn lesson

  • Nenne die 3 Formen der Objektivität 1. Testleiterunabhängigkeit (Durchführungsobjektivität)2. Verrechnungssicherheit (Auswertungsobjektivität)3. Interpretationseindeutigkeit (Interpretationsobjektivität)
  • Nenne die 3 Hauptarten von Reliabilitäten 1. Paralleltest-Reliabilität2. Retest-Reliabilität3. innere Konsistenz (Cronbach's alpha, Split-Half)
  • Was ist die Paralleltest-Reliabilität? Testwiederholung bei der gleichen Stichprobe mit einer völlig gleichwertigen Nachahmung des Tests; Korrelation zwischen Test und Paralleltest = Ausmaß, in dem die Relationen der Testwerte der einzelnen Tpn zueinander konstant bleiben.
  • Was misst die Korrelation zwischen Test und Paralleltest eigentlich in der KTT? Letztlich nur wie gut die Konstruktion des Paralleltests gelungen ist, und weniger ein Kriterium für die Exaktheit der Messung.
  • Was gibt Cronbach-alpha an? Bloß eine Abschätzung, nämlich eine untere Grenze der Reliabilität.
  • Was wird in der "Konsistenzanalyse" gemacht? Methode zu inneren Konsistenz; Test wird in so viele Teile zerlegt wie es Items gibt.--> Kuder-Richardson-Formel 20 (= nur dichotom zu verrechnende Items)
  • Nenne 3 verschieden Arten von Validität 1. Inhaltliche Gültigkeit2. Konstruktvalidität3. Kriteriumsvalidität
  • Wann ist von "Inhaltlicher Gültigkeit" zu sprechen? Wenn ein Test stichprobenartig, das optimale Kriterium des interessierenden Merkmals darstellt.
  • Was ist die leichteste Methode um inhaltliche Validität zu erfassen? Welche Gefahr besteht jedoch? "Experten-Rating" im Hinblick auf die operationale Definition durch Experten; es besteht jedoch die Gefahr der Tradierung.
  • Was versteht an unter "ökologischer Validität"? Sie zielt darauf ab, dass das psychologische Diagnostizieren den Anforderungen der natürlichen Lebensbedingungen entspricht.
  • Was ist ein Konstrukt? Und wann erfüllt ein Test Konstruktvalidität? Konstrukt = allgemein anerkannte, aber eben nicht direkt beobachtbare Phänomene, wie z.B. Intelligenz, Angst oder Stress; Wenn ein Test gewisse theoretische bzw. theoriegeleitete Vorstellungen in Bezug auf irgendein "Konstrukt"erfüllt.
  • Wann ist von "konvergenter" bzw. "diskriminanter Validität" zu sprechen? Wenn der zu validierende Test im selben Faktor wie der konstruktnahe Test lädt und er gleichzeitig in denjenigen Faktoren gerade nicht lädt, welche durch die ihm konstruktfernen Tests bestimmt sind (= Konstruktvalidität)
  • Welche Reliabilitäten erfassen alle monomethodischen-monotrait-Korrelationskoeffizienten? Sie quantifizieren die Parallel- bzw. Retest-Reliabilität des betreffenden Tests.
  • Die heteromethodischen-monotrait-Korrelationskoeffizienten sind als welche Reliabilitäsart aufzufassen? innere Konsistenz (Split-Half, Cronbachs-alpha)
  • Welche Validitäten sind den monomethodischen-heterotrait-Korrelationskoeffizienten bei a) konstruktnahen Tests b) konstruktfernen Tests zuzuordnen? a) konvergente Validitätb) diskriminante Validität
  • Was wird bei der Kriteriumsvalidität gemacht? Wo liegen mögliche Probleme? Eine bestimmte als relevant angesehene Variable (sog. "Außenkriterium") wird mit dem interessierenden Test korreliert.Das Problem liegt jedoch darin, ein geeignetes Außenkriterium überhaupt zu finden, sowie darin, dass dieses seinerseits nicht hundertprozentig messgenau sein wird.
  • Nach welchen zwei Gesichtspunkten können die möglichen Außenkriterien gruppiert werden? 1) Übereinstimmungsvalidität (Konkurrente Validität)= bezieht sich auf die Korrelation mit einem anderen Test, der (angeblich) dasselbe Konstrukt erfasst. 2) Vorhersagegültigkeit/ prognostische Validität= bestimmt sich aus der Korrelation des fraglichen Tests mit einem Außenkriterium, das in (ferner) Zukunft liegt (z.B. Prüfungserfolg). Ein bestimmtes später beobachtbares Kriterium soll also vorhergesagt werden.
  • Was kann als ein neues Validierungskonzept angesehen werden? Und was liegt ihm zugrunde? Die "Evaluation diagnosespezifischer Förderung".Wenn ein Test valide sein soll, dann muss er mit seiner Diagnose zumindest zwischen zwei Gruppen differenzieren sein (auch mehr als zwei in Differenzialdiagnostik).
  • Wann ist das Gütekriterium "Eichung" erfüllt? Wenn für sein Bezugssystem zur Relativierung des individuellen Testergebnisses (die sog. "Eichtabellen) folgende Bedigungen gegeben sind:- Die Eichtabellen sind gültig d.h. nicht veraltet- die Population für die die Eichtabellen gelten, ist definiert,- die für die Erstellung der Eichtabellen herangezogenen Stichprobe ist repräsentativ.
  • Was meint Eichen im Sinn von Relativieren? Die gewonnen Testwerte, werden in Relation zur Referenzpopulation bzw. "Vergleichsgruppe" gesetzt, die für den Vergleich der Tp relevant sind.
  • Was meint Eichung im Sinne von Repräsentativerhebung? Damit das Relativieren überhaupt möglich ist, bedarf es der Erfassung der fraglichen Referenzpopulation mit Mitteln der statistische Stichprobentheorie.
  • Welcher Verteilung entspricht der Eichmaßstab "Prozentrang" (PR)? Er entspricht der Verteilungsfunktion der Standardnormalverteilung an der Stelle z0
  • Was gibt der PR an? Den relativen Anteil von Personen in der Referenzpopulation, die denselben oder einen nidrigeren Testwert erreichen.
  • Wie sind die PR bei nicht normalverteilten Testwerten bestimmbar? Indem sie unmittelbar aus der Häufigkeitsfunktion der Eichstichprobe bestimmt werden.
  • Wann müssen Eichtabellen laut DIN 33430 erneuert werden? Spätestens alle 8 Jahre; sollte sich zwischenzeitlich empirisch gezeigt werden, dass die Normwerte die jeweilige Referenzgruppe nicht zutreffend beschreiben, so sind sie vor Ablauf dieser Frist neu zu normieren.
  • Was ist eine sog. "Klumpenerhebung"? Welche Stichprobenart ist es? Was ist dabei wichtig? (Mehr oder weniger) eine Vollerhebung einzelner "Klumpen" von Datenträgern z.B. einzelne Schulen und deren Schulkinder.Wichtig: Wenigstens die Klumpen sollten zufällig gewählt werden, am besten nach regional festgelegter Quote --> "Quotenstichprobe": Sollte in Bezug auf wesentliche Variablen Berücksichtigung finden z.B. Schultypen, Geschlechter, Altersstufen --> entsprechend relativen Anteilen in der Population.
  • Wann stören Mängel in der Repräsentativität nicht? Wenn zwischen dem nicht-repräsentativen Merkmal und den Testwerten in der fraglichen Eigenschaft kein Zusammenhang besteht.
  • Welche Art von Tpn sollte möglichst vermieden werden und was sollte gemacht werden, falls diese doch anfallen? Volunteers, bei deren Gebrauch stets eine "Non-Responder-Analyse" angezeigt.
  • Was bedeutet "Kriteriumsorientierte Diagnostik"? Und was kommt als möglicher Vergleichsmaßstab in Frage (1 Beispiel)? Kriteriumsorientierte Diagnostik bedeutet, dass andere Vergleichsmaßstäbe zur Interpretation eines Testwerts herangezogen werden als die Testwertverteilung in der Referenzpopulation.Als möglicher Vergleichsmaßstab kommt entweder ein absolut festgelegter oder individuumsbezogener, relativ gewählter Ziel-Testwert in Frage, z.B. Therpieerfolg wird untersucht vorher-nacher Vergleich mit der Depression Scale vorher Wert von 70, cut-off ab 50, alles darunter nicht depressiv; nach der Therapie ein Wert von 45.
  • Was stellt eine - soziale Bezugsnorm - individuelle Bezugsnorm - sachliche, "kriteriumsorientierte" Bezugsnorm da? - soziale Bezugsnorm = Referenzpopulation, soziale "Norm" traditionell "normorientierte Diagn."- individuelle Bezugsnorm = individuelle Veränderung; Testwert wird auf Wert aus früherer Testung bezogen- sachliche, "kriteriumsorientierte" Bezugsnorm = Testwert wird auf ein bestimmtes Kriterium (Lern- oder Therapieziel) bezogen.
  • Für welche Ansätze ist der Ansatz der kriteriumsorientierten Diagnostik besonders von Bedeutung mit Beispiel? - Für die pädagogisch-psychologische Diagnostik; in Bezug auf Individuum und Gruppe, Bedingungen für Lehr- und Lernprozesse ermitteln und analysieren, um den individuellen Lernerfolg zu optimieren.- Für die klinisch-psychologische Diagnostik, im Zuge einer (psycho-)therapieleitenden Diagnostik.
  • Was ist das "Testprofil"? Die graphische oder auch nicht-graphische Darstellung der Ergebnisse eines Tests.
  • Wann erfüllt ein Test das Gütekriterium Skalierung? Wenn die laut Verrechnungsvorschriften resultierenden Testwerte die empirischen Verhaltensrelationen adäquat abbilden.Es geht also um die Angemessenheit der im Manual eines Tests festgesetzten Reglementierung, wie die einzelnen Testleistungen einer Tp zu einem numerischen Testwert zu verrechnen sind.= Anspruch auf "faktische Gegebenheit" (Gegensatz zu "apodiktischer bzw. willkürlicher Festsetzung" im Sinne der Messtheorie in der empirischen Psychologie)
  • Woraus ergibt sich laut KTT die (Item-)Schwierigkeit? Bei dichotom zu verrechnenden Aufgaben als die relative Lösungshäufigkeit, mit der eine Aufgabe in der Eichstichprobe gelöst wurde.
  • Was für Methoden bietet die KTT an um zu versuchen, dass pro Test eindimensionale Messungen erzielt werden? (gehört zu Skalierung) - Innere Konsistenz - Faktorenanalyse- Interkorrelationen
  • Bei der Zielsetzung eindimensionaler Messungen soll die innere Konsistenz, Faktorenanalyse und Interkorrelationen möglichst wie sein? Möglichst groß; die Items sollen gemeinsam auf einen einzigen Faktor laden und die Interkorrelationen aller Items nahezu 1 betragen.
  • Was fordert die KTT bei der Itemzusammenstellung eines Tests neben innerer Konsistenz usw. auch noch? - dass sich die Schwierigkeit der Items gleichmäßig innerhalb des Intervalls 0,05 bis 0,95 verteilen- dass die sog. "Trennschärfeindizes" der Items (= Korrelation des Testwerts pro Item mit Testwert aus allen übrigen Items) sehr hohe Werte annehmen.
  • Warum müssen die Methoden der KTT grundsätzlich kritisiert werden? Da sie alle Stichprobenabhängig sind.Somit wäre für die skizzierten Ansätze der KTT durch geeignete Stichprobenauswahl praktisch jeder (gewünschte) Wert erreichbar (manipulierbar) - daher völlig wertlose Ansätze.
  • Welche Theorie kann im Gegensatz zur KTT durchaus prüfen, ob die gegebenen Verrechnungsvorschriften eines Tests zu Testwerten führen, die verhaltensadäquate Relationen wiedergeben? Die Item-Response-Theorie (IRT) --> "Verechnungsfairness"
  • Was meint die "lokal stochastische Unabhängigkeit" im RM? Ob eine Tp eine Aufgabe löst oder nicht, hängt, abgesehen vom Zufall, nur von iherer Fähigkeit und von der Schwierigkeit der Aufgabe ab, nicht aber davon welche anderen Aufgaben sie schon gelöst hat oder noch lösen wird.
  • Tests die nicht Rasch-Modell entsprechen sind was nicht? Verrechnungsfair
  • Von welchen Parametern hängt das RM ab? Die Wahrscheinlichkeit, dass die TP v Item i löst ist abhängig vom "Personenparameter" (= wahre Fähigkeit von v) und dem "Itemparameter" (= wahre Schwierigkeit von i)
  • Welchen wissenschaftstheorteischen Ansatz erfüllt das RM? Sog. "spezifische objektive" Vergleiche; Stichprobenunabhägigkeit + Itemunabhägigkeit
  • Wie erfolgt Inferenzstatistisch der Modelltest des Rasch-Modells? Sinngemäß über einen Likelihood-Quotienten-Test
  • Was für einer Testung Bedarf es vor dem universellen Einsatz eines Tests in mehreren Kulturen? Wo findet es noch Verwendung? Einem "Äquivalenztest";Muss auch duchgeführt werden, wenn ein Papier-Bleistift-Verfahren für die Vorgabe am Computer adaptiert werden soll.
  • Was ist beim Äquivalentest zu prüfen? - Wird in beiden Fällen dieselbe Eigenschaftsdimension gemessen (RM gilt für für beide getrennt sowie für beide insgesamt)? - Stimmt für beide Fälle der Mittelwert der Testwerte (in jeweils repräsentativen Stichproben) überein? - Stimmt für beide Fälle die Verteilung der Testwerte, zumindest die SD (in jeweils repräsentativen Stichproben) für beide Fälle überein?
  • Was findet man seit einigen Jahren unter dem Stichwort "Differential Item Functioning"? (sog. "Item Bias") Bemühung um Methoden, die die unterschiedlichen Messqualitäten vereinzelter Items in diversen Subpopulationen festzustellen erlauben. --> brauchbare Methoden, laufen auf einschlägige oder eben besondere Modelltest zum RM hinaus
  • Wann erfüllt ein Test das Gütekriterium Ökonomie? Wenn er, gemessen am diagnostischen Informationsgewinn, relativ wenig Ressourcen (Zeit und Geld) beansprucht. nach Lienert:- kurze Durchführungszeit- wenig Material- einfach zu handhaben- Gruppentest möglich- schnell & bequem auszuwerten
  • Was sind mögliche Kosten einer Testung? - Anschaffung des Tests- Personalkosten des Tl- Anschaffungs- & Betriebskosten/ Verschleißkosten von Computern- Verbrauch von Protokollbogen bzw. Gebühr für computerisierte Tests
  • Wann verfehlt psychologisches Diagnostizieren seinen Zweck? - als Tl eine nicht ausreichend ausgebildete Person fungiert- auf den Einsatz eines sinnvollen Tests verzichtet wird, der wertvolle diagn.Infos liefern würde- Test verwendet werden, anstatt eine sinnvollere systematische Verhaltensbeobachtung zu machen- Psychologe nur Tests einsetzt die ihm seit Jahren vertraut sind, aber wenig Infos liefern als andere-  Nur mit der Krankenkasse abrechenbare Tests eingesetzt werden, obwohl andere Infogewinn steigern könnten- Auswahl des Tests primär nach dem Kriterium ob Vorgabe und Auswertung über Computer möglich sind.