Pädagogische Psychologie (Fach) / Pädagogisch Psychologische Diagnostik (Lektion)
In dieser Lektion befinden sich 87 Karteikarten
Frühjahrssemester 2018
Diese Lektion wurde von chaemmerli81 erstellt.
Diese Lektion ist leider nicht zum lernen freigegeben.
- Arten diagnostischer Entscheidungen Nutzen der Entscheidung zu Gunsten von Institutionen vs. Individuum z.b. Bewerberauswahl vs. Berufsberatung Annahmequote festgelegt vs. variabel z.B. begrenzte Anzahl Studienplätze vs. alle Geeigneten dürfen studieren Behandlung singulär vs. multibel z.B. eng umschriebene Massnahme (Therapie eines Klienten) vs. Kombination von Massnahmen (Einbezug von Familie, Peers, Lehrkräfte) Möglichkeit von Ablehnung ja vs. nein z.B. Platzierung (alle Personen verbleiben im System) vs. Selektion Informationsdimension univariat vs. multivariat z.B. diagnostische Info basiert aus Maturanote vs. Maturanote + Intelligenztest Entscheidungen terminal vs. investigaroisch z.B. Jobzusage vs. Vorauswahl für Zulassug zu Assessment Center
- Kompensatorische Entscheidungsstrategien Ausgleich ungenügender Leistungskontrollen durch bestimme Anzahl genügender Leistungskontrollen Kombination von Inforamtionen z.B. Notendurchschnitt
- Oder-Strategie Für Auswahl/Bestehen genügt ein hoher Punktwert in einem Prädiktor Im Gegensatz zu Kompensatorischen Strategie wird keine Summe aus Teilwerten gebildet z.B. Lehrperson wird angestellt, wenn sie entweder in Mathematik oder Chemie didaktisch stark ist
- Konjunktive (Und-) Entscheidungsstrategien Anwendung, wenn in mindestens zwei Teilbereichen Mindestleistungen erforderlich sind Multiple Cutoff-Werte > Festgelegte Mindestwerte in zwei Prädiktoren z.B. Chriurg muss sowohl eine hinreichende Intelligenz als auch feinmotorische Fertigkeiten aufweisen
- Einstufige/Nichtsequentielle Entscheidungsstrategie Nichtsequentielle Batterie: Gesamte Batterie von diagnostischen Verfahren wird allen Probanden vorgegeben und es werden diejenigen ausgewählt, die den festgelegten höchst Wert erzielen > Annahme oder Ablehnung basiert auf Gesamtergebnis z.B. Summenscore aller Tests. Einzelteststrategien (Single Screen): Weitere Entscheidung (Annahme oder Ablehnung) basieren auf Ergebnisse von einem einzigen diagnostischen Verfahren. Wird in Praxis häufig eingesetzt aus Zeit- und Kostengründen!
- Mehrstufige/Sequentielle Entscheidungsstrategien Vorauswahl-(Pre-reject) Strategie Vorentscheidung- (Pre-accept) Strategie Vollständige sequentielle Strategie
- Vorauswahl-(Pre-reject) Strategie Nach einem ersten Test werden alle Probanden, die einen bestimmten Wert nicht erreicht haben, von weiteren Tests ausgeschlossen und abgelehnt. Verbleibende Probanden absolvieren weitere Tests. Die Entscheidung über Ablehnung vs. Annahme basiert auf Kombination zwischen Erst- und Folgetests.
- Vorentscheidung- (Pre-accept) Strategie Nach einem ersten Test werden alle Probanden, die einen bestimmten Cut-Off-Wert erreichen/überschreiten, bereits terminal akzeptiert. Mit den verbleibenden Probanden wird analog zur Vorauswahlstrategie verfahren, d.h. sie absolvieren weitere Tests und die Entscheidung über Ablehnung vs. Annahme wird aus der Kombination zwischen Erst- und Folgetests getroffen.
- Vollständige sequentielle Strategie Nach Massgabe der Punktwerte in einem Test erfolgt eine Aufteilung aller Probanden in drei Gruppen: die Akzeptierten (terminal), die definitiv Abgewiesenen und die, die an einem Folgetest teilnehmen dürfen. Auch hier erfolgt die Entscheidung über Annahme vs. Ablehnung aufgrund der Kombination zwischen Erst- und Folgetest
- Definition Entscheidungsfehler Entscheidungsfehler = Wenn Zuordnung aufgrund der Prädiktorvariablen nicht mit der tatsächlichen Klassenzugehörigkeit übereinsteimmt. Aufgabe von Zuordnungsstrategien: Vermeidung von Fehlern bei Klassenzuordnung Praktische und finanzielle Konsequenzen von Fehlbesetzungen
- Arten von Zuordnungsfehler Fehler erster Art = falsche Positive, d.h. Personen werden als krank diagnostiziert, obwohl sie gesund sind Fehler zweiter Art = falsche Negative, d.h. Personen werden als gesund diagnostiziert, obwohl sie krank sind
- Gütekriterien einer Zuordnungsstrategie Sensitivität (bez. auf Messinstrument/diagnostische Strategie) Spezifität Positiver Prädiktionswert Negativer Prädiktionswert
- Sensitivität Wahrscheinlichkeit, mit der ein vorliegender positiver Zustand als solcher erkannt wird
- Spezifität Wahrscheinlichkeit, mit der ein negativer Zustande als solcher erkannt wird
- Positiver Prädiktionswert Wahrscheinlichkeit, mit der eine positive Diagnose zutrifft (Anteil der richtig diagnostizierten Kranken an allen als krank diagnostizierten Personen)
- Negativer Prädiktionswert Wahrscheinlichkeit, mit der eine negative Diagnose zutreffend ist (Anteil der richtig diagnostizierten Gesunden in der Gruppe der als gesund diagnostizierten Personen)
-
- Verhaltensvariabilität 1 Situativer Druck führt zu Verhaltenskonformität und lässt "trait"-geleitete individuelle Verhaltensunterschiede verschwinden > Interindividuelle Unterschiede verschwinden > behindert Diagnostik z.B. rote Verkehrsampel stellt für alle Verkehrsteilnehmer ein starker Stimulus dar mit hohem Uniformitätsdruck. z.B. Items in Persönlichkeitsfragebogen produzieren keinen Informationsgewinn, da alle Schüler aus Gründen der sozialen Erwünschtheit dasselbe ankreuzen, wenn LP über die Schulter schaut > Auslesesituationen regen konformes Verhalten an Testsituation standardisieren, damit interindividuelle Verhaltensunterschied nicht durch Situation bedingt sind. Kontextuelle Rahmenbedingungen müssen derart gestallt sein, dass individuelle Unterschiede hervortreten. Hilfreich ist die zusätzliche Erfassung der subjektiven Besonderheiten bei der Wahrnehmung und Verarbeitung der Informationen über die Anforderungsmerkmale einer (Test-)Situation.
- Verhaltensvariabilität 2 Intraindividuelle Verhaltensunterschiede erklärt sich häufig als Folge veränderter situativer Anforderungen.
- Forschungsstand zur aktuellen Selbstaufmerksamkeit Reflektierte/selbstaufmerksame sind validere Selbstbeschreibungen als sponatne Selbstbeschreibungen > sagen Verhalten besser vor. Übliche Instruktion in FB, bei der Beantwortung der Items "nicht lange nachzudenken", stellt daher ein folgenschwerer Missgriff dar > fördern sozial erwünschtes Antwortverhalten. Empfehlung für psychodiagnostische Praxis: Durch geeignete Massnahmen, z.B. einführendes Gespräch oder ausführliche Exploration, situative Rahmenbedingungen dafür zu schaffen, dass die Testperson sich selbst in möglichst adäquater Weise beschreiben kann.
- Ziel von Aggregation von Massen Reliabilitätserhöhung durch Aggregation (von vorherzusagendem Verhalten) über Beobachtungszeitpunkte, Verhaltensweisen (z.B. Kommandieren, Drohen, Delegieren als Dimensionen für Dominanz) und Situationen können zu einer substantiellen Erhöhung der Validität führen. (Summierung über verschiedene Verhaltensweisen bewirkt eine Erhöhung der Reliabilität, der Heterogenität und der inhaltlichen Breite, mit der Folge höherer Validitäten und transsituativer Verhaltenskonsistenzen).
- Moderation/lineare Moderatorvariablen: Personengruppen mit einer besonderes hohen Vorhersagbarkeit - Empirische Befunde Moderatoransatz ermöglicht Identifizierung solcher Personengruppen, die in den Kategorien von Eigenschaftsdimensionen recht gut beschrieben und vorhergesagt werden können > Moderatorvariablen beeinflussen die Validität! z.B. Schulische Leistungen (Kriterium) sind aus Intelligenztests (Konstrukt) besser für solche Schüler vorhersagbar, die eine hohe Konformität an den schulischen Betrieb und eine gute Betragensnote aufweisen. z.B. Für Personen mit hohen (i.V. zu mittleren und niedrigen) Punktwerten in "Lügenskalen" kann von einer geringeren Validität ihrer Fragebogenbeantwortung ausgegangen werden. z.B. Für Konsistenz und damit Prognostizierbarkeit spielt das Ausmass an Selbstkontrolle und Selbstbewusstheit eine bedeutsame Rolle. > Bei anderen Personen müssten dagagen für eine Vorhersage eher die Gegebenheiten oder Wahrnehmung der jeweiligen Situation herangezogen werden.
- Definiton von Psychologischer Diagnostik Sie ist eine Teildisziplin der Psychologie. Sie dient der Beantwortung von Fragestellungen, die sich auf die Beschreibung, Klassifikation, Erklärung oder Vorhersage menschlichen Verhaltens und Erlebens beziehen. Sie schliesst die gezielt Erhebung von Informationen über das Verhalten und Erleben eines oder mehrerer Menschen sowie deren relevanten Bedigungen ein. Zur Erhebung von Informationen werden Methoden verwendet, die wissenschaftlichen Standards genügen. Die erhobenen Informationen werden für die Beantwortung der Fragestellung interpretiert. Das diagnostische Handeln wird von psychologischem Wissen geleitet.
- Geschichte der Psychologischen Diagnostik Sir Francis Galton (1884) > erste Meesungen interindividueller Unterschiede in geistigen Fähigkeiten Clark Wissler (1901) > erste systematische Validierungsstudie zu kognitiven Tests (korrelierte Testleistung mit Studienleistung von 300 Studis. Korrelationen waren so niedrig, dass Testung geistiger Fähigkeit mit Tests von Galton als gescheitert galt). Alfred Binet (1905) > entwickelte erster moderner Intelligenztest im Auftrag des franz. Unterrichtsministeriums, um geistig zurückgebliebene Kinder zu entdecken und angemessen beschulen zu können.
- Zweck Psychologischer Diagnostik Selektion: von Personen (Auszubildenden, Studierenden, Stellenbewerber) oder von Bedingungen (Berufs- & Studienberatung, Trainingsmassnahmen) Modifikation: von Verhalten (Aus- & Fortbildung, Training, Coaching) oder von Bedigungen (Arbeitszeit, -platz, Aufagben)
- Verschiedene Itemformate Freie vs. Gebundene Antworten Freie Antworten (z.B. Rorschacher-Test, strukturierte klinische Interviews) Eingeschränkte freie Antworten (z.B. Ergänzungen bei Lückentexte, Sprechblasen, teils auch projektive Verfahren) Zuordnungs- & Sortieraufgaben > Zwei Spalten: Jedes Element der einen Spalte muss einem Element der anderen Spalte zugeordnet werden (z.B. Bilder zuordnen im Wechsler Test) Multiple Choice & Forced Choice Aufgaben (Bei Persönichkeitsfragebögen: von mehreren, ähnlich sozial erwünschten, Antworten indiziert eine das Merkmal) Beurteilungsaufgaben > beurteilen, wie gut eine Aussage auf einem zutrifft oder wie häufig das Verhalten auftritt (z.B. 5-stufige Likertskala) Dichotome Antworten > ja/nein, Trifft zu/Trifft nicht zu
- Vor- & Nachteile von freien & eingeschränkt freien Antworten Vorteile von freien Antworten: Geeignet, wenn komplexes Denken, originelle Lösungen oder Praxistransfer erfasst werden soll Nachteile von freien Antworten: Auswertung meist aufwändig Auswertungsobjektivität eingeschränkt Antwort kann von mündlicher bzw. schriftlicher Ausdrucksfähigkeit abhängen Vorteile von eingeschränkt freien Antworten: Geeignet, wenn verfügbares Wissen und nicht blosses Wiedererkennen erfasst werden soll, ebenso für originelle Lösungen Nachteile von eingeschränkt freien Antworten: Auswertung eher aufwändig Auswertungsobjektivität eventuell eingeschränkt
- Vor- & Nachteile von Zuordnungs- & Sorteieraufgaben Vorteile: Zur Erfassung von Wissen & Kenntnissen geeignet Objektiv und ökonomisch auszuwerten (mit Auswertungsschablonen- & Programmen) Nachteile: Erfasst nur Wiedererkennen und nicht freien Abruf von Gedächtnisinhalten
- Vor- & Nachteile von Multiple Choice & Forced Choice Aufgaben Vorteile: Objektiv & ökonomisch auszuwerten Nachteile: Gute Distraktorn oft schwer zu finden Erfasst bei Leistungstests nur Wiedererkennen und nicht freien Abruf von Gedächtnisinhalten Ratewahrscheinlichkeit hoch (kann reduziert werden, wenn auch mehrere Antworten richtig sein können)
- Vor- & Nachteile von Beurteilungsaufgaben Vorteile: Objektiv & ökonomisch auszuwerten Liefert differenziertere Informationen als dichotome Antwortskala
- Vor- & Nachteile von Aufgaben mit dichotomen Antworten Vorteile: Objektiv & ökonomisch auszuwerten Nachteile: Entscheidung wird oft erzwungen > bei nicht klarer Antwort ist trotzdem eine der beiden Alternativen anzukreuzen
- Regeln zur Abfassung von Items Möglichst verständliche Sprache verwenden & kurze Sätze> keine Fremdwörter, doppelten Negationen. Auf Passung zu Antwortmögichkeiten achten. Vorsicht bei Invertierung von Items. Oft gelingt es nicht, genau das Gegenteil auszudrücken > z.B. "Ich bin mit meinem Leben zufrieden" vs. "Ich bin mit meinem Leben unzufrieden" > Wer meint, nicht (ganz) zufrieden zu sein, sagt damit nicht, er sei unzufrieden.
- Definition von Item Trennschärfe Trennschärfe einer Aufgabe ist definiert als die Korrelation des Items mit dem Test oder der Skala des Tests, zu der das Item gehört. Der Test- bzw. der Skalenwert wird dabei über alle Items mit Ausnahme des analysierten bestimmt. Sie soll eine Einschätzung ermöglichen, wie ein Item zwischen Probanden mit niedriger und hoher Merkmalsausprägung trennt. Sie ist ein Kennwert dafür, in welchem Ausmass die durch das Item erfolgte Differenzierung der Probanden in Löser und Nichtlöser mit derjenigen durch die Skala als Ganzes übereinstimmt.
-
- Objektivität Bedeutet, dass die Ergebnisse eines diagnostischen Verfahrens unabhängig davon zustande kommen, wer die Untersuchung (Durchführungsobjektivität), die Auswertung (Auswertungsobjektivität) und die Interpretation (Interpretationsobjektivität) durchführt. > wird durch Standardisierung von Durchführung, Auswertung und Interpretation gewährleistet
- Reliabilität Reliabilität beschreibt die Genauigkeit, mit der ein Test ein Merkmal erfasst, und zwar unter Vernachlässigung des Umstandes, ob es sich dabei auch um die Merkmalsdimension handelt, deren Erfassung intendiert ist. > Messung wird kaum durch unsystematische Messfehler gestört
- Schätzmethoden für Reliabilität Retest-Reliabilität Parallelstestreliabilität Split-half-Reliabilität Bestimmung der Trennschärfe & Schwierigkeitskoeffizienten > Cronbachs α
- Retest-Reliabilität Derselbe Test wird derselben Stichprobe wiederholt vorgelegt Gemessnes Merkmal kann sich zwischen T1 und T2 verändern > Retest-Relibalität von Stabilität des Merkmals beeinflusst Retestintervall hat Einfluss auf Retest-Reliabilität Bei Persönlichkeitsfragebögen: Alter hat Einfluss auf Höhe des Koeffizienten > je älter Testperson, desto stabiler ihre Persönlichkeitsmerkmale > Extraversion ist stabilstes Merkmal, Neurotizismus am wenigsten stabil Bei Intelligenztests: weisen sehr hohe Retest-Reliabilität auf vgl. mit Persönlichkeitsfragebögen; Intelligenz = stabiles Merkmal > Höhe der Koeffizienten hängt von Alter & Retestintervall > je kürzer das Intervall desto höher der Wert (evtl. Erinnerungs- & Übungseffekte) > wenn doch niedrige Werte, können diese auf Testqualität u/o nicht konstante Durchführungsbedingungen zurückgeführt werden
- Paralleltestreliabilität Merkmal wird mit zwei (fast) identischen Tests gemssen (z.B. Version A & B von WIT-2) Zwischen Bearbeitung der Parallelversion nur kurzes Zeitintervall von einigen Tagen Herstellung von parallel Formen erschwert, wenn zu messende Eigenschaft sehr eng begrenzt ist > kleiner Itempool > u/o einmalige Fragen, die durch Parallelisierung zu Transfer von Lösungsprinzipien & erheblichen Übungsgewinn führen Speedtests als mögliche Lösung > zahlreiche ähnliche Items müssen in kurzer Zeit bearbeitet werden > Ähnlichkeit von Items in Paralleltest hat keinen Einfluss auf Ergebnis, da Zeit entscheidend ist
- Split-half-Reliabilität Dadurch können Schwankungen von Motivation, Stimmung & Aufmerksamkeit/Fluktuation des untersuchten Merkmals ausgeschlossen werden Kommt Konzept einer Beschreibung der primär instrumentellen Messgenauigkeit am nächsten Voraussetzung: Homogenität & Anzahl der Items müssen Aufteilung in zwei Hälften erlauben Bei projektiven Test ist diese Voraussetzung nicht gegeben
- Bestimmung der Trennschärfe - Konsistenzschätzung Testskala in einzelne Items zerlegen Varianz des Skalensummenwerts setzt sich aus Summe aller Itemvarianzen & Interintemkovarianzen zusammen > Ohne Itemkovarianz, würde jedes Item etwas anderes messen, damit wäre Skala nicht reliabel/konsistent Cronbachs α = Konsistenzkoeffizient (0/1)
- Einflussfaktoren auf Reliabilität - Wie hoch soll R sein? Homogenität des Merkmals > hohe interne Konsistenz Heterogenität des Merkmals > geringere interne Konsistenz Messfehler > geringe interne Konsistenz > beachten von Retest- oder Parallelreliabilität Heterogene Stichproben > hoher Reliabilitätskoeffizient aufgrund grosser Streunung der Testwerte Homogene Stichproben > niedriger Reliabilitätskoeffizient aufgrund kleiner Streunung der Testwerte Grosse Stichprobe > höhere Reliabilitätskoeffizient > kleiners Konfidenzintervall > genauere Schätzung des wahren Wertes möglich Kleine Stichprobe > niedriger Reliabilitätskoeffizient > grösseres Konfidenzintervall > nur grobe Schätzung des wahren Wertes (vgl. mit beobachtetem Wert) möglich > Je grösser das Konfidenzintervall desto geringer die Reliabilität Geringe Reliabilität > Misst Test ungenau, ist auch die einzelne Messung unzuverlässig
- Definition von Validität Unter Validität wir die Übereinstimmung von Testergebnissen mit dem, was der Test messen soll, verstanden. Es handelt sich um ein Urteil darüber, wie angemessen bestimmte Schlussfolgerungen vom Testwert auf das Verhalten ausserhalb des Tests oder auf ein Merkmal der Person sind. Wichtigstes Gütekriterium Hohe Reliabilität & Objektivität ist Voraussetzung aber keine Garantie! Ist von Verwendungszweck des Tests abhängig
- Inhaltsvalidität Def. Darunter versteht man, wie repräsentativ die Items eines Tests für das zu messende Merkmal sind. Belege für Inhaltsvalidität: Konzepte offenlegen, die Itemgenerierung zugrunde liegen Itemselektion dokumentieren Expertenurteile zu Passung zwischen Merkmal und Item, das Merkmal messen soll
- Kriteriumsvalidität Def. Darunter versteht man den Zusammenhang zwischen Testergebnis und konkreter Leistung oder konkreten Verhaltensweisen ausserhalb der Testsituation. Das Kriterium muss für den vorgesehenen Einsatzbereich des Tests relevant sein. Kriterium = etwas direkt Messbares z.B. Prüfungsleistungen, Abiturnote, erzielter Umsatz, Vorgesetzenbeurteilungen, Berufserfolg oder auch Verhaltensweisen wie Studienabbruch, Reduktion der Nahrungsaufnahme, Alkoholkonsum Begehen einer Straftat z.B. Messen von Alkoholismus anhand von Alkoholkonsum = Kriterium! Kriterium ≠ Konstrukte (z.B. Intelligenz) Kriteriumsvalidität wird anhand von Korrelationskoeffizienten, Mittelwertsunterschieden oder Effektstärken angegeben
- Arten der Kriteriumsvalidität Übereinstimmungsvalidität (concurrent validity) = Erhebung des Kriterium im gleichen Zeitraum wie Testdurchführung Vorhersagevalidität (predictive validity) = Erhebung des Kriterium erfolgt deutlich später als Testdurchführung (z.B. Intelligenz > Berufserfolg = Kriterium) Inkrementelle Validität Zuwachs an Validität durch Einsatz mehrer ergänzender Testverfahren > damit werden weiter noch nicht berücksichtigte Aspekte des Kriteriums erfasst. Liegt auch vor, wenn ein neues Verfahren gegenüber seinem Vorgänger oder konkurrierenden Verfahren zusätzliche Kriteriumsvarianz erfasst aufgrund höhere Reliabilität oder breiterer Erfassung des Kriteriums > Einsatz von unökonomischen Tests nur gerechtfertigt, wenn sie gegenüber ökonomischen Test eine inkrementelle Validität aufweisen. z.B. Bei Kombination von Intelligenztest und strukturiertem Eigenungsinterview (beides gute Prädiktoren für Berufserfolg, beide r einfache Korrelation= . 51) weisen Letztere eine beträchtliche inkrementelle Validität auf indem sie durchschnittlich weitere 14% der Varianz des Berufserfolgs aufklären (R multiple Korrelation= .63)
- Konstruktvalidität Def. Darunter versteht man empirische Belege dafür, dass ein Test das Konstrukt erfasst, welches er erfassen soll - und nicht ein anderes. Konstrukte = existieren nicht real > gedankliche Konstrukte/abstrakte Konzepte werden bestimmte Eigenschaften zugeschrieben z.B. Intelligenz sind in nomologischen Netzwerken verankert > Aussagen & Gesetze über Zusammenhang zwischen a) beobachtbaren Merkmalen, b) theoretischen Konstrukten & beobachtbaren Merkmalen & c) verschiedenen theoretischen Konstrukten. Konstrukte wie Unbewusste & Alexithymie sind problematisch zu operationalisieren & emp. Evidenz ist widersprüchlich/schwach Nachweis erforderlich, dass Test das angestrebte Konstrukt erfasst!
- Konvergente vs. Diskriminante/Divergente (Konstrukt-) Validität Konvergente Validität = Zusammenhang mit weiteren Indikatoren des Konstrukts, das man erfassen will Konstrukte, die dem zu messenden Konstrukt konzeptuell nahestehen, z.B. Verfahren für Selbstkontrolle korreliert mit Verfahren für Selbstregulation Konvergente Validität muss höher sein als diskriminante Validität! Diskriminante Validität = Zusammenhang mit Indikatoren von anderen Konstrukten, z.B. wenn ein Verfahren für Furcht vor Misserfolg mit einem anderen Verfahren für Furcht vor Misserfolg aber auch mit einem Neurotizismusfragebogen korreliert
- 6 Belege für Konstruktvalidität Gruppenunterschiede, z.B. Einstellung zur Kirche sollte bei Kirchengänger höher sein als bei Nicht-Kirchengänger Korrelation & Faktorenladung: Tests zum gleichen Konstrukt sollten positiv korreliern bzw. in einer Faktormatrix auf den gleichen Faktor laden Interne Struktur: Items, die das gleiche Konstrukt erfassen, sollten positiv korreliert sein. Es wird eine angemessene interne Konsistenz gefordert und davor gewarnt, dass eine hohe Konsistenz die Validität reduzieren kann. Auch die faktorielle Struktur ist wichtig, wenn der Test Konstrukte mit einer bestimmten Struktur erfassen soll > Intelligenztests Veränderung über die Zeit: Eine hohe oder eine niedrige Stabilität des Merkmals sollte sich in entsprechenden Retest-Reliabilitätskoeffizienten des Tests zeigen > Testwertveränderungen > Leistungsmerkmale wie Intelligenz nehmen in der Kindheit und Jugend deutlich zu. Veränderung durch experimentelle Intervention, z.B. eine Depressionsskala zeigt nach einer erfolgreichen Therapie niedrigere Werte an als vorher Untersuchung des Antwortprozesses, d.h. wie kommt die Antwort in einem Test zustande. Z.B. in einem Rechentest beruhen falsche Antworten oft darauf, dass Probanden die Frage falsch verstehen > Hinweis darauf, dass nicht nur Rechenfertigkeiten sondern auch Instuktionsverständnis oder Sprachverstehen erfasst wird.
- Faktoren, die die Höhe der Validität beeinflussen Merkmale des Tests > Reliabilität des Tests Merkmale des Kriteriums > Reliabilität & Validität des Kriteriums Gemeinsame Merkmale von Test & Kriterium > Gemeinsame Methodenvarianz & Konfundierung mit dem gleichen Merkmal Merkmale der untersuchten Personen > Umfang & Merkmale der Stichprobe
- Einflussfaktoren auf Validität 1. Reliabilität des Tests 2. Reliabilität & Validität des Kriteriums 3. Gemeinsame Methodenvarianz von Test & Kriterium 4. Symmetrie zwischen Prädiktor (Test) & Kriterium Partielle Symmetrie (Kriterium zu eng) > Erfassung von K & P(Test) auf unterschiedlichen Generalisierungsniveau; Globaler Test wird mit spez. Kriterium in Beziehung gesetzt. Partielle Symmetrie (Test zu eng) > Prädiktor zu eng operationalisiert. Hybride Asymmetrie > Gleiches Generalisierungsniveau, aber K & Test sind inhaltlich unterschiedlich zusammengesetzt; Kennwerte haben inhaltliche Gemeinsamkeit, werden aber durch andere Merkmale mit beeinflusst. Totale Asymmetrie > Test erfasst konzeptuell etwas ganz anderes als Kriterium 5. Konfundierung mit dem gleichen Merkmal 6. Umfang & Merkmale der Stirchprobe
- Normierung Normierung eines Tests liefert ein Bezugssystem, um individuelle Testwerte im Vergleich zu denen einer grösseren udn meist repräsentativen Stichprobe von Probaden einordnen zu können. Wichtig für Individualdiagnostik Gilt als Gütekriterium; Normierungs- oder Eichstichprobe muss hinreichend gross, repräsentativ für den vorgesehenen Geltungsbereich & die Erhebung der Daten möglichst aktuell sein. Bezugsrahmen zur Interpretation von Rohpunktwerten > werden in transformierte Werte übertragen: Prozentrangnorm > Keine Annahmen über Verteilung der Testwerte; Testwert wird die relative Position auf der nach Grösse ranggereihten Messwertskala der Bezugsgruppe zugeordnet. Äquivalentnorm > Zuordnung von Rohwerten zu bestimmten Referenzgruppe (z.B. Altersgruppe). Variabilitäts- oder Abweichungsnorm > Messwerte müssen i.S. der Gaussschen Kurve normalverteilt sein. Normwert gibt an, wie weit Testleistung einer Person unter/über dem MW einer Vergleichsgruppe (Alters-, Geschlechts-, schul- & Bildungsspez. Normen) liegt.
-