Diagnostik - Psychologie learn online

Psychologie (Subject) / Diagnostik (Lesson)

There are 181 cards in this lesson

WS 12/13

This lesson was created by derloda.

Learn lesson

Woraus kann man Ableiten, dass der Erwartungswert des Fehlers 0 ist? Verbindung von Existenz- und Verknüpfungsaxiom Aus der Kombination von Existenz- und Verknüpfungsaxiom und der Unkorreliertheit der Fehler ergibt sich, dass der Erwartungswert des Fehlers gleich null ist.
Welches Gütekriterium steht im Zentrum der KTT? Im Zentrum der KTT steht das Gütekriterium der Reliabiliät: Definition: Die Reliabilität bezeichnet die Messgenauigkeit eines Tests und ist als Anteil der Varianz der wahren Werte an der Varianz der beobachteten Testwerte definiert.
Was bedeutet ein Reliabilitätskoeffizient von .70? Ein Reliabilitätskoeffizient von rtt = .70 bedeutet, dass die beobachtete Testwertevarianz zu 70% auf wahre Unterschiede zwischen den Testpersonen zurückzuführen ist und zu 30% auf Fehlervarianz beruht.
Was ist ein Standardmessfehler? Inwiefern hängt der SD von der Rel. ab? Definition: Der Standardmessfehler ist derjenige Anteil an der Streuung eines Tests, der zu Lasten seiner (gewöhnlich nicht perfekten, also unvollständigen“) Zuverlässigkeit geht. Ist der Reliabilitätskoeffizient berechnet oder einem Testmanual entnommnen, ist die Varianzzerlegung ganz einfach: SD(ε) = SD(x) * √1-Rel
Was ist ein Konfidenzintervall? Was braucht man, um dieses zu berechnen? Mit Hilfe des Standardmessfehlers ist es möglich, um die Schätzung des wahren Wertes (τv), der sich aus dem Mittelwert der gemessenen Werte(^τv) ergibt, einen Bereich zu definieren, in dem der wahre Wert mit einer bestimmten Wahrscheinlichkeit (1–α) liegt.Dieser Bereich wird Vertrauens- oder Konfidenzintervall genannt.
Was versteht man unter einer Minderungskorrektur? - Wegen des Verknüpfungsaxioms ist bekannt, dass sich jeder gemessene Wert aus einem wahren Wert und einem Messfehler zusammensetzt. • Möchte man nun wissen, inwieweit zwei wahre Werte zweier gemessener Variablen (z.B. zweier Intelligenztests) miteinander korrelieren, benutzt man Minderungskorrekturen, da die Korrelationen zwischen den Variablen andernfalls aufgrund der Fehlerbehaftetheit der Messwerte unterschätzt würden. Rwtwu= rxtxu √rtt*√ruu Mit r(wtwu) als Korrelation zwischen den wahren Werten von zwei Tests t und u, wenn deren Reliabilitäten rtt und ruu bekannt sind. Diese Minderungskorrektur geht zurück auf Spearman. Es handelt sich um eine Schätzung, wie hoch beide Variablenmiteinander korrelieren würden, wenn sie nicht messfehlerbehaftet wären.
Was versteht man unter Kriteriumsvalidität? Zur Validierung eines Tests werden die mit dem Test gemessenen Werte oft mit einem externen Kriterium korreliert (Kriteriumsvalidität). Das oben beschriebene Problem, der verminderten Korrelation auf Grund der nicht perfekten Reliabilität von Kriterium und Test ergibt sich auch hier. c+tCorr rtc= rtc √rtt*√rcc mit r(tt) als Reliabilität des Tests und r(cc) als Reliabilität des Kriteriums und r(tc) als Korrelation zwischen beiden.
Was versteht man unter einer einfachen/ doppelten Minderungskorrektur? Im Falle der einfachen Minderungskorrektur wird angenommen, dass entweder das Kriterium oder der Test absolut zuverlässig ist. Falls die Unzuverlässigkeit einer der Variablen interessiert, behebbar und korrigierbar ist. c+tCorr rtc= rtc √rtt Mit rtc als Korrelation zwischen Test und Kriterium und rtt als Reliabilität des Tests.
Was versteht man unter einer einfachen/ doppelten Minderungskorrektur? Im Falle der einfachen Minderungskorrektur wird angenommen, dass entweder das Kriterium oder der Test absolut zuverlässig ist. Falls die Unzuverlässigkeit einer der Variablen interessiert, behebbar und korrigierbar ist. c+tCorr rtc= rtc √rtt Mit rtc als Korrelation zwischen Test und Kriterium und rtt als Reliabilität des Tests.
Was versteht man unter einer einfachen/ doppelten Minderungskorrektur? Im Falle der einfachen Minderungskorrektur wird angenommen, dass entweder das Kriterium oder der Test absolut zuverlässig ist. Falls die Unzuverlässigkeit einer der Variablen interessiert, behebbar und korrigierbar ist. c+tCorr rtc= rtc √rtt Mit rtc als Korrelation zwischen Test und Kriterium und rtt als Reliabilität des Tests.
Was versteht man unter einer einfachen/ doppelten Minderungskorrektur? Im Falle der einfachen Minderungskorrektur wird angenommen, dass entweder das Kriterium oder der Test absolut zuverlässig ist. Falls die Unzuverlässigkeit einer der Variablen interessiert, behebbar und korrigierbar ist. c+tCorr rtc= rtc √rtt Mit rtc als Korrelation zwischen Test und Kriterium und rtt als Reliabilität des Tests.
Wie kann man die Reliabilität eines Tests erhöhen? Warum funktioniert das und welche Voraussetzung an den Test muss erfüllt sein? • Je länger ein Test, desto höher seine Reliabilität Mit größer werdender Zahl Items, die alle dasselbe messen, stellt sich ein Fehlerausgleich ein (gleiche wahre Werte und Unkorreliertheit der Messfehler). Spearman- Brown- Formel corr rtt= k * rtt 1+(k-1)rtt • Die Spearman- Brown Formel gibt an, wie sich die Reliabilität eines Testes rtt durch Verlängerung um den Faktor k ändern würde Voraussetzung: Alle Testteile (Items) müssen einander äquivalent und homogen sein.
Wie kann man bestimmen, um wie viele Items ein Test verlängert werden muss, um die Reliabilität zu erhöhen? Spearman- Brown- Formel corr rtt= k * rtt 1+(k-1)rtt • Die Spearman- Brown Formel gibt an, wie sich die Reliabilität eines Testes rtt durch Verlängerung um den Faktor k ändern würde Voraussetzung: Alle Testteile (Items) müssen einander äquivalent und homogen sein.
Wozu dient die Spearman-Brown-Formel? • Die Spearman- Brown Formel gibt an, wie sich die Reliabilität eines Testes rtt durch Verlängerung um den Faktor k ändern würde Voraussetzung: Alle Testteile (Items) müssen einander äquivalent und homogen sein.
Wie kann man feststellen, ob sich zwei Personen in einem Intelligenztest unterschiedlich abgeschnitten haben? Ob sich zwei Untertests signifikant unterscheiden? Ob eine Intervention wirksam war? Um zu ermitteln, ob sich zwei gemessene Testwerte überzufällig voneinander unterscheiden, muss eine kritische Differenz berechnet werden. Dkrit = za/2 * sx √2(1-rtt) DKrit entspricht der Differenz, die übertroffen werden muss, um von einem empirisch bedeutsamen Unterschied sprechen zu können. Anwendungen Kritische Differenz • Wiederholte Testung Möchte man wissen, ob sich die Testwerte eines Pbn nach einem Training oder einer Therapie verändert haben • Differenzen in verschiedenen Skalen Zur Ermittlung von Stärken und Schwächen in verschiedenen Untertests
Welche Kritikpunkte liefert die KTT? Stärken der KTT • Gute Bewährung der nach der KTT entwickelten Tests in psychodiagnostischer Handhabung • Ökonomischer Ansatz zur Entwicklung von TestsDie meisten der heute auf dem Markt erhältlichen Tests sind nach den Regeln der KTT konzipiert. Probleme • Die Axiome der KTT sind empirisch nicht überprüfbar • Die Annahme einer intraindividuellen Invarianz der wahren Werte einer Person ist nur haltbar bei kurzen Zeiträumen. • Es ist nicht überprüfbar, welches Skalenniveau Tests aufweisen. Die KTT setzt jedoch Intervallskalenniveau voraus. • Populations-/ StichprobenabhängigkeitDie Reliabilitätskoeffizienten fallen je nach Heterogenität bzw. Homogenität der Stichprobenzusammensetzung eher hoch oder niedrig aus. • Aussagekraft gruppenstatistischer Kennwerte für den Einzelfall?
Wesentlicher Unterschied KTT und IRT? KTT: • Die KTT setzt den (messfehlerbehafteten) Messwert mit der Ausprägung des zu erfassenden psychischen Merkmals gleich. • Ein Test wird daher als eine direkte Operationalisierung des Persönlichkeitsmerkmals betrachtet, welches er erfassen soll. • Im Rahmen der KTT werden keine Aussagen über Zusammenhänge zwischen psychischen Merkmalen und dem Verhalten in einem Test formuliert. IRT: beschäftigt sich mit der Frage, welche Schlüsse aus dem Antwortverhalten eines Pbn in einem bestimmten Test auf die dahinterliegenden Fähigkeiten gezogen werden können.
Zwei Ebenen von Variablen in der IRT? • manifesten Variablen: das beobachtbare Antwortverhalten in einem Test (Lösen/ Nicht-Lösen von Testitems) • latenten Variablen: die nicht beobachtbaren Fähigkeiten oder Dispositionen, die hinter dem manifesten Verhalten liegen (Trait, z.B. Rechenfähigkeit) • In Modellen mit latenten Variablen werden unterschiedliche Ausprägungen einer latenten Variablen mit systematischen Unterschieden im beobachtbaren Verhalten verknüpft. • Für die manifesten Verhaltensvariablen werden dementsprechend in Abhängigkeit von der Ausprägung des latenten Merkmals bestimmte Werte erwartet.
Was versteht man unter einer Itemanalyse? Item: kleinste Einheit eines Tests einzelne Fragen, Aufgaben, Aussagen Items müssen an einer möglichst repräsentativen Stichprobe einer deskriptiv-statistischen Evaluation unterzogen werden = Itemanalyse.
Nach welchen Qualitätsmerkmalen beurteilt man Items? • Itemschwierigkeit • Trennschärfe • Homogenität
Schwierigkeit bei Speedtests? Geschwindigkeitstests/ Speedtests: Bei unbegrenzter Zeitvorgabe werden alle Items von allen Probanden gelöst (Schwierigkeitsgrad konvergiert gegen Null - Differenzierung der Pbn über die Bearbeitungszeit) häufig Konzentrations- oder Aufmerksamkeitstests wie der d2 oder FAIR
Powertests? Niveautests/ Powertests: Auch bei unbegrenzter Zeitvorgabe werden von keinem Pbn alle Aufgaben richtig gelöst (Ermittlung von intellektuellem Niveau oder Denkkraft). meist Intelligenztests wie der HAWIK oder HAWIE
Was gibt der Schwierigkeitsindex p an? Der Schwierigkeitsindex gibt an, wie groß der Anteil der Probanden ist, die das Item richtig (bei Persönlichkeitstests im Sinne einer höheren Merkmalsausprägung) gelöst haben. P = Nr/N*100 p = Schwierigkeitsindex NR = Zahl der Pbn, die die Aufgabe im Sinne des Merkmals beantwortet haben N = Zahl aller Pbn
Was bedeutet eine hohe Itemschwierigkeit? Hohe Werte von p stehen für eine niedrige Schwierigkeit.
Was gibt es bei multiple choice Aufgaben hinsichtlich der Schwierigkeit zu beachten? 1. Zufallskorrektur Itemschwierigkeit Bei Mehrfachwahlaufgaben ist es möglich, dass richtige Antworten der Pbn durch Zufall zustande kommen. P = {NR - [NF/(m-1)] / N}*100 Mit NF = Zahl der Pbn, die die Aufgabe falschbeantwortet haben und m = Zahl der Wahlmöglichkeiten in einer Mehrfachwahlaufgabe- 2. Ratekorrektur Itemschwierigkeit Bei Mehrfachwahlaufgaben können richtige Antworten auch durch Raten zustande kommen. ->Benachteiligung von Pbn, die lieber keine, als eine unsichere Antwort abgeben. Um den zufallskorrigierten Testwert einer Person zu erhalten, ist vom ursprünglichen Testwert die Anzahl der zufällig richtig gelösten Aufgaben abzuziehen. X' = nr – [nf / (m-1)] > richtig/falsch: X' = nr – nf Achtung! Formel verändert sich, wenn mehr als eine Antwort richtig sein kann. Dies gilt unter der Annahme, dass falsche Antworten allein durch Raten zustande kommen (ng = nr + nf).
Was ist bei zeitlimitierten Aufgaben hinsichtlich der Schwierigkeit zu beachten? Wenn wegen einer Zeitbegrenzung nicht alle Aufgaben von einer Person bearbeitet werden konnten, muss für die Ermittlung der Schwierigkeit die Gesamtzahl aller Probanden um diejenigen Probanden verringert werden, die die Aufgabe nicht bearbeitet haben. p = (NR / NB) * 100 NB : Zahl der Pbn, die die Aufgabe bearbeitet haben Mit Zufallskorrektur ergibt sich dann: P = {NR - [NF/(m-1)] / NB}*100
Wo sollte p liegen? Mittlere Werte (P um 50) bedeuten größtmögliche Streuung und eine hohe Differenzierung zwischen den Pbn. Breite Streuung der Schwierigkeitskoeffizienten (zwischen 5 und 95) jedoch nötig, um auch in den Randbereichen differenzieren zu können.
Was misst die Trennschärfe? Was ist zu beachten? Die Trennschärfe ist die Korrelation der Itembeantwortung mit dem Summenwert der Skala, zu der das betreffende Item gehört. Sie ist ein Kennwert dafür, in welchem Ausmaß die Differenzierung der Probanden in Löser/ Nicht-Löser durch das Item mit demjenigen durch die Skala als Ganzes übereinstimmen. Der Trennschärfe eines Items ist zu entnehmen, inwieweit ein einzelnes Item das Gesamtergebnis eines Tests/ einer Skala vorhersagen kann. Eine hohe Trennschärfe bedeutet, dass das Item zwischen den Probanden im Sinne des Gesamttests zu differenzieren vermag.
Voraussetzung für hohe Trennschärfe? • Vorausetzung der Testwertbildung ist die Itemhomogenität (alle Items müssen inhaltlich dasselbe messen). • Eine hohe Itemvarianz begünstigt eine hohe Trennschärfe bei intervallskalierten und dichotomen Items. → Bei Varianz = 0 könnte man die Pbn nicht unterscheiden.
Zusammenhang Schwierigkeit und Trennschärfe? Zusammenhang zwischen Trennschärfe und Schwierigkeit meist umgekehrt u-förmige Beziehung. Sehr hohe und sehr niedrige Schwierigkeiten gehen mit mäßigen Trennschärfen einher. Mittlere Schwierigkeiten mit eher hohen Trennschärfen. [• Nur bei hoher Homogenität (Interkorrelation) der Items sind hohe Trennschärfeindizes möglich. Problem: unterschiedliche Trennschärfen verringern die Homogenität der Items.]
Welches ist das übergeordnete Item-Güte? Implikationen: Trennschärfe • Items mit niedriger Trennschärfe werden für die Testendform aussortiert, selbst wenn ihre Schwierigkeit optimal ist. • Items mit hoher Trennschärfe werden beibehalten, selbst wenn sie extrem leicht oder schwierig sind. Itemschwierigkeit und Itemtrennschärfe müssen bei der Itemselektion gleichzeitig berücksichtigt werden! • ItemschwierigkeitBei Erfassung extremer Merkmalsausprägungen: 5 ≤ Pi ≤ 20 bzw. 80 ≤ Pi ≤ 95Bei Erfassung in allen Bereichen: 5 ≤ Pi ≤ 95 • Itemtrennschärfe (Untergrenze: .30 oder .40)
Was ist Homogenität? Die Homogenität eines Tests gibt an, wie hoch die verschiedenen Items miteinander korrelieren. → Bei hoher Homogenität erfassen alle Items ähnliche Informationen (formale und inhaltliche Einheitlichkeit). • Mit homogenen Skalen lassen sich nur enge Merkmalsaspekte erfassen. → Konzentrationstests: d2, KLT
Was ist unter einem psychologischen Test/ Fragebogen zu verstehen? "Ein Test ist ein wissenschaftliches Routineverfahren zur Untersuchung eines oder mehrerer empirisch abgrenzbarer Persönlichkeitsmerkmale mit dem Ziel einer möglichst quantitativen Aussage über den relativen Grad der individuellen Merkmalsausprägung." Routineverfahren: Durchführung und Auswertung sind bereits an einer größeren Stichprobe erprobt und er ist auch von anderen Personen mit anderen Testleitern durchführbar. "wissenschaftlich": Es gibt eine Theorie, unter welchen Bedingungen aus den Testergebnissen welche Aussagen über die getesteten Personen abgeleitet werden können (Testtheorie). Persönlichkeitsmerkmale: Erfassung eines relativ stabilen und konsistenten Merkmals der Personen, das für das im Test gezeigte Verhalten verantwortlich ist. Rost (2004, S. 18): "Bei einem Test handelt es sich um ein spezielles psychologisches Experiment mit dem Ziel, vergleichende Aussagen über die Personen abzuleiten." Ein psychologischer Test stellt einen Spezialfall eines Experimentes dar. Die unabhängige Variable ist ein Item (Messwiederholung), die abhängige Variable die Itemantwort. Ein Test besteht aus Reizkomponenten (z.B. Fragebogenitems oder IQ-Testaufgaben) und Anweisungen zur Interpretation des darauf gezeigten Verhaltens (z.B. angekreuzte Antworten, angegebene Lösungen).
Was unterscheidet einen unwissenschaftlichen Test (Fragensammlung) von einem wissenschaftlich fundierten psychologischen Test? → Empirische Überprüfung der Erfüllung von Testgütekriterien
Hauptgütekriterien eines Tests/ Nebengütekriterien? Hauptgütekriterien • Objektivität • Reliabilität • Validität Nebengütekriterien • Skalierung • Normierung (Eichung) • Testökonomie (Ressourcen, wie Zeit und Geld) • Nützlichkeit (praktische Relevanz, Nutzen für Entscheidungen) • Zumutbarkeit (zeitliche, physische und psychische Belastung) • Unverfälschbarkeit (Manipulierbarkeit des Testwertes) • Fairness (systematische Benachteiligung von Gruppen)
Was ist Objektivität? Formen von Objektivität? „Objektivität beschreibt das Ausmaß, indem die Testergebnisse unabhängig vom Untersuchungsleiter sind“ • Durchführungsobjektivität (maximale Standardisierung der Testsituation) • Auswertungsobjektivität (Verhalten also eindeutig quantifizierbar ist (Lösungsschlüssel)) • Interpretationsobjektivität (verschiedene Testanwender ziehen gleiche Schlüsse)
Reliabilität: Definition, Arten der Reliabilität Die Reliabilität beschreibt die Genauigkeit mit der ein Test ein Merkmal misst (= Zuverlässigkeit). Ein Test misst dann absolut reliabel, wenn er frei von Messfehlern misst. • Reliabilität = Anteil der wahren Varianz an der Gesamtvarianz der Testwert• Ausgedrückt durch Reliabilitätskoeffizient• Reliabilität eines guten Tests sollte 0.7 nicht unterschreiten! Arten: • Retest – Reliabilität • Paralleltestreliabilität • Testhalbierung • Innere Konsistenz
Wann ist ein Test ein Paralleltest? Vorteil? Die Reliabilität wird bestimmt als Korrelation zweier paralleler Testformen A und B (inhaltlich möglichst ähnliche Items: Itemzwillinge). • Parallel sind Tests dann, wenn die beobachteten Mittelwerte und Standardabweichungen identisch und die Korrelationen zwischen den beobachteten Werten hoch sind. • Problem: Erstellung paralleler Testversionen sehr aufwendig • Vorteil: Reliabilitätsverändernde Einflüsse (Übungs-/ Erinnerungseinflüsse) sind besser kontrolliert
Vorteil Testhalbierung? Was ist bei dieser Art der Testung zu bedenken? Aufteilung des Tests in zwei äquivalente Hälften und Korrelation der Testergebnisse wenn die Möglichkeit für eine Testwiederholung nicht gegeben ist. - Schwankungen in Motivation, Erinnerungseffekte, Übungseffekte, Veränderungen des Merkmals können praktisch ausgeschlossen werden. - Schätzung der Reliabilität des Gesamttests muss dann auf die doppelte Länge aufgewertet werden. Besser: Erstellung paralleler Testhälften • Odd- Even Methode (Aufteilung nach geraden und ungeraden Items) • Aufteilung der Items nach Zufall • Aufteilung der Items nach ähnlicher Schwierigkeit und Trennschärfe > Aufwendigste Methode, bei sehr heterogenen Items • Bei Speedtests Aufteilung nach Bearbeitungszeit
Was ist Validität? Übereinstimmung zwischen dem Merkmal, das man messen will und dem tatsächlich gemessenen Merkmal (Gültigkeit).
Arten der Validität? • Inhaltliche Validität • Kriteriumsbezogene Validität • Konstruktvalidität
Was ist Augenscheinvalidität? Augenscheinvalidität gibt an, inwieweit der Validitätsanspruch eines Tests einem Laien‚ vom bloßen Augenschein her gerechtfertigt erscheint, d.h. auf Seiten der Testperson der Test Akzeptanz genießt.
Was ist kriteriumsbezogene Validität? Konkurrente/ prädiktive Validität? Die Kriteriumsvalidität bezieht sich auf die praktische Anwendbarkeit eines Tests für die Vorhersage von Verhalten und Erleben. Definition: Ein Test weist Kriteriumsvalidität auf, wenn vom Verhalten der Testperson innerhalb der Testsituation erfolgreich auf ein Kriterium, nämlich das Verhalten außerhalb der Testsituation, geschlossen werden kann. Die Enge der Beziehung ist das Ausmaß an Kriteriumsvalidität (Korrelationschluss). Korrelationsschluss vom Testergebnis auf ein Kriterium, den es immer bedarf, wenn es nicht möglich ist, das Zielmerkmal als Ganzes in einem Test zusammenzustellen: z.B. Einschulungstest bei dem auf die Schulfähigkeit/ den Schulerfolg im 1. Schuljahr geschlossen wird. Intelligenztest bei dem auf den Schulerfolg/ Berufserfolg insgesamt geschlossen wird. In Abhängigkeit von zeitlicher Verfügbarkeit des Kriteriums (Gegenwart vs. Zukunft): Konkurrente Validität: wenn Test- und Kriteriumswert gleichzeitig erhoben werden Prädiktive Validität: wenn zu einem Zeitpunkt t1 die Testscores und zu einem späteren Zeitpunkt t2 die Kriterienwerte erhoben werden Wichtiger: zeitlich früheres Ereignis kann ursächlich verantwortlich sein für ein zeitlich späteres und somit dieses erklären.
Konstruktvalidität? Ein Test weist Konstruktvalidität auf, wenn der Schluss vom Verhalten der Testperson innerhalb der Testsituation auf zugrunde liegende psychologische Persönlichkeitsmerkmale ("Konstrukte", "latente Variablen", "Traits") wie Fähigkeiten, Dispositionen, Charakterzüge, Einstellungen aufgezeigt wurde. Die Enge dieser Beziehung wird aufgrund von testtheoretischen Annahmen und Modellen überprüft.
Wozu dienen nomologische Netzwerke? Synthese aus inhaltlicher und kriteriumbezogener Validität • Im Bereich der Theorie werden nicht beobachtbare theoretische Konstrukte und deren theoretischen Zusammenhänge („Axiome“) untereinander definiert. •Es werden Annahmen („Korrespondenzregeln“) formuliert, welche Konstrukte in Verbindung mit welchen beobachtbaren Testwerten stehen. (Nomologisches Netz) •Aufgrund der theoretischen Zusammenhänge von Konstrukten lassen sich entsprechende Vorhersagen für die Zusammenhänge beobachtbarer Testwerte ableiten, die empirisch überprüfbar sind.
Konvergente/ diskriminante Validität? Man unterscheidet die konvergente von der diskriminanten Validität: Konvergente Validität liegt vor, wenn Messungen eines Konstruktes, das mit verschiedenen Methoden erfasst wird, hoch miteinander korrelieren. Diskriminante Validität liegt vor, wenn Messungen verschiedener Konstrukte, die mit derselben Methode gemessen werden, nicht oder nur gering miteinander korrelieren.
Was versteht man unter Normierung (Testeichung)? Unter der Normierung (Eichung) eines Tests versteht man das Erstellen eines Bezugssystems, mit dessen Hilfe die Ergebnisse einer Testperson im Vergleich zu den Merkmalsausprägungen anderer Personen (der Eichstichprobe) eindeutig eingeordnet und interpretiert werden können. Ergebnisse der Testeichung dokumentiert man in „Normtabellen“ und die Testergebnisse einer Person werden dann in Relation zu Testergebnissen von Personen aus der möglichst repräsentativen Eichstichprobe interpretiert. Nennen Sie eine Möglichkeit, einen Test zu normieren. Zwei Verfahren zur Bildung von Normwerten: (1) Bildung von Prozentrangnormen (durch nicht-lineare Transformation auf Basis der Häufigkeitsverteilung) (2) Bildung von Standardnormen (durch Standardisierung an Mittelwert und Standardabweichung der Testwerteverteilung, z.B. IQWerte, T-Werte…) Prozentrangnormen : - Ein Prozentrang gibt an, wie viel Prozent der Bezugsgruppe einen Testwert erzielten, der niedriger oder maximal ebenso hoch ist, wie der Testswert xi der Testperson v. • Der Prozentrang kumuliert die in der Eichstichprobe erzielten prozentualen Häufigkeiten der Testwerte, beginnend am Skalenende bis einschließlich zu jenem Testwert xi, den die gerade interessierende Testperson erzielte. Vorteile: • Voraussetzungslosigkeit der Verteilungsform • Leichte Verständlichkeit PR von 90 bedeutet, dass nur 90 % der Vergleichsstichprobe denselben oder einen geringeren Testwert erreicht haben. Nachteile: • Gleiche Abstände haben verschiedene Bedeutungen Standardnormen • Der Normwert gibt an, wie stark der individuelle Testwert einer Testperson vom Mittelwert der Verteilung der Bezugsgruppe in Einheiten der Standardabweichung SD der Verteilung abweicht. • Berechung des - Normwertes (Standardwertes): Wenn Messwerte nicht normalverteilt sind, verbietet sich eine Transformation in Standardnormen!
Wie kann man die Testökonomie erhöhen? Kosten, die bei Testung entstehen: finanzieller Aufwand für das Testmaterial und zeitlicher Aufwand für die Testdurchführung inklusive Zeit für Vorbereitung, Auswertung und Ergebnisrückmeldung) Ein Test erfüllt das Gütekriterium der Ökonomie, wenn er, gemessen am diagnostischen Erkenntnisgewinn, relativ wenig Ressourcen wie Zeit, Geld oder andere Formen beansprucht. Beispiel: branched-testing
Was versteht man unter Testfairnis? Ein Test erfüllt das Gütekriterium der Fairness, wenn die resultierenden Testwerte zu keiner systematischen Benachteiligung bestimmter Personen aufgrund ihrer Zugehörigkeit zu ethnischen, soziokulturellen oder geschlechtsspezifischen Gruppen führen. 1. Das Modell der proportionalen Repräsentation Eine Selektionsmaßnahme gilt dann als fair, wenn in der Stichprobe der ausgewählten Bewerber die Proportion der miteinander verglichenen Gruppen dieselbe ist wie in der Bewerberpopulation (z.B. Geschlechter, soziale Schichten, regionale Herkunft etc.) Problem: Systematische Gruppenunterschiede: Ein Alkoholiker kann nicht mit einer verantwortungsvollen Aufgabe betreut werden, weil er im Vergleich zu anderen Alkoholikern besonders gut abgeschnitten hat. Nicht alle Unterschiede können berücksichtigt werden.
Was ist Aufgabe des Testkuratoriums? Das Diagnostik- und Testkuratorium besteht seit 1986 und ist ein vom Berufsverband Deutscher Psychologinnen und Psychologen e.V. und von der Deutschen Gesellschaft für Psychologie e.V. getragenes Gremium, dessen Aufgabe es ist, die Öffentlichkeit vor unzureichenden diagnostischen Verfahren und vor unqualifizierter Anwendung diagnostischer Verfahren zu schützen. Es setzt mit dem Testbeurteilungssystem TBS-TK Standards für die Rezension von psychologisch-diagnostischen Verfahren und trägt somit zur Qualitätsverbesserung diagnostischer Verfahren und Entscheidungen bei.

Learn online - when and where you want!

Psychologie (Subject) / Diagnostik (Lesson)