Psychologie (Subject) / Testtheorie (Lesson)

There are 134 cards in this lesson

Tutoriumsfolien

This lesson was created by FlorianMiehe.

Learn lesson

  • wenn zwei tests zwei verschiedenen stichproben vorgelegt werden, wie prüft man, ob es sich dabei um parrallele tests handelt? 1. mittelwerte und varianz berechnen2. mittelwerte vergleichen: t-test3. varianzen vergleichen: f-test-> wenn nicht signifikant = äquivalente messung
  • wie sieht die Formel der reliabilität aus? rel = v²(tau) / v²(X) oder  rel = v²(tau) / v²(tau) + v²(epsilon)
  • ab wann spricht man von einer guten reliabilität? rel > 0,8
  • was bedeutet reliabilität? •Die Reliabilität eines Tests gibt den Grad der Genauigkeit an, mit dem der Test ein bestimmtes Merkmal misst•Die Reliabilität gibt den Anteil der Varianz der wahren Werte an der Varianz der beobachteten Werte anz.B. nimmt man eine Reliabilität von r = .50, dann bestimmen die systematische Varianz (50 Prozent) und der Messfehler (50 Prozent) den Testwertzu gleichen Anteilen.-> Ein solcher Test besitzt folglich eine unbefriedigende Reliabilität oder Messgenauigkeit (Je größer die Varianz der Messfehler, desto geringer die Variabilität (siehe Formel))
  • wann ist ein test vollständig reliabel? wenn er das Merkmal, das er misst, exakt, d.h. ohne Messfehler misst
  • studierendenfrage: worin unterscheiden sich diese beiden Formeln? rel = rho (XA, XB) und rêl = r (XA, XB) griechische Buchstaben (wie in rel = rho (XA, XB)) werden für die Population verwendetund ^ stehen für schätzer aus der stichprobe, wie in rêl = r (XA, XB)
  • welche formel zur berechnung der neuen reliabilität verwendet man, wenn man einen test verlängern/ um einige items kürzen will? spearman brown formel
  • wie berechnet man den verlängerungsfaktor K der spearman brown formel? K = Anzahl d. Items des verlängerten tests / Anzahl d. Items des Orginaltests
  • wie berechnet man die retest reliabilität? man korreliert die beiden testergebnisse miteinander (zweiseitige pearson korrelation)
  • wie berechnet man die split-half-reliabilität? 1. test in der mitte teilen/ gerade-ungerade2. mittelwerte oder summe der items bilden3. pearson- korrelation berechnen zwischen den summen/ mittelwerten
  • wie berechnet man die innere konsistenz eines tests? indem man alle items miteinander korreliert (cronbach alpha)-> Bei parallelen Items/Testteilen stellt das Cronbachs Alpha eineSchätzung der Reliabilität dar-> wenn die Items nicht zumindest Tau-äquivalent sind ist dasCronbachs Alpha lediglich eine Schätzung für die untere Schranke derReliabilität.
  • mit welcher der beiden methoden (auf basis messfehler/ schätzfehlervarianz) erhält man ein schmaleres Konfidenzintervall? auf basis der schätzfehlervarianz, allerdings muss μ bekannt sein! daher nach möglickeit 2. Formel wählen
  • nenne die kritischen z-werte (1-α) der standardnormalverteilung 95%: zkrit= 1.9699%: zkrit= 2.58(beides zweiseitig)
  • wie prüft man ob 2 konfidenzintervalle sich signifikant voneinander unterscheiden? beide KI bestimmen -> wenn sie sich schneiden, keine signifikanz
  • wann ist ein test valide? Ein Test gilt dann als valide („gültig“), wenn er das Merkmal, das er messen soll, wirklich misst- Beispiel: Eine Person stellt sich auf eine WaageWas wollen wir messen? -> Gewicht in Kilogramm (nicht Temperatur in Fahreinheit; nicht eine Zahl, die uns angibt ,wie viele Personen
  • welche beiden formen der Konstruktvalidität gibt es? •Konvergente Validität•Diskriminante (= divergente) Validität
  • was versteht man unter normierung/ eichung? Unter Normierung(Eichung) eines Tests versteht man, das Erstellen eines Bezugssystems, mit dessen Hilfe die Ergebnisse einer Testperson im Vergleich zu den Merkmalsausprägungen anderer Personen eindeutig eingeordnet und interpretiert werden können.
  • was versteht man unter skalierung? Ein Test erfüllt das Gütekriterium Skalierung, wenn die laut Verrechnungsregel resultierenden Testwerte die empirische Merkmalsrelation adäquat abbilden.
  • wann kann das gütekriterium der eichung/normierung als erfüllt angesehen werden? –die Eichtabellen gültig (d.h.nichtveraltet) sind,–die Population für die Eichtabelle definiert ist und–die für die Erstellung der Eichtabellen herangezogene Stichprobe repräsentativ ist*.
  • Neben der Überlegung, welcher Bereich validiert werden soll, ist zu überlegen, auf welcher Definition das zu erfassende Merkmal basiert. welche 2 merkmalsdefinitionen gibt es? - operational: wenn dieTestaufgaben den interessierenden Anforderungsbereich direkt repräsentieren. (z.b.kurzzeitgedächtnis test ) - theoretisch: Theorien werden herangezogen, die spezifizieren (verdeutlichen), worauf bestimmte Unterschiede zwischen Personen zurückgeführt werden können und wie sich diese Unterschiede in den Testergebnissen ausdrücken. (z.b. extraversion) => Die Grenzen zwischen den beiden Definitionen sind allerdings fließend.
  • was ist inhaltsvalidität? Inhalts validität bezieht sich darauf, inwieweit die Inhalte der Tests bzw. der Items, aus denen sich ein Test zusammensetzt, tatsächlich das interessierende Merkmal erfassen. z.B.Wie gut decken die Fragen, die bei der Testtheorieprüfung gestellt werden, das vorgetragene Stoffgebiet ab?
  • was ist die augenscheinvalidität? Augenscheinvalidität gibt an, in wie weit der Validitätsanspruch eines Tests vom bloßen Augenschein her einem Laien gerechtfertigt erscheint.
  • wie berechnet man die konstruktvalidität? Multitrait-Multimethod-Matrix
  • welche bedingungen sollte die multitrait-multimethod-matrix zur messung der konstruktvalidität erfüllen? Tipp: mTmM, hTmM/ mThM, hThM mTmM: korrelationen, bei denen dasselbe merkmal mit derselben methode erfasst wird (retest reliabilität) sollten höher sein als messungen desselben merkmals mit unterschiedlichen methoden hTmM/ mThM: korreliert man messungen, bei denen dasselbe merkmal mit unterschiedlichen methoden gemessen wird (mThM) sollten die korrelationen höher sein als die messung unterschiedlicher merkmale mit derselben methode (hTmM) - Korrelationen von der Messung unterschiedlicher Merkmale mit derselben methode (hTmM) sollten höher sein als Korrelationen unterschiedlicher merkmale mit unterschiedlichen methoden
  • was bedeutet kriteriumsvalidität? Kriteriumsvalidität bedeutet, dass von einem Testergebnis, auf ein für diagnostische Entscheidungen praktisch relevantes Kriterium außerhalb der Testsituation geschlossen werden kann. Kriteriumsvalidität kann durch empirische Zusammenhänge zwischen dem Testwert und möglichen Außenkriterien belegt werden. Je enger diese Zusammenhänge, desto besser kann die Kriteriumsvalidität als belegt gelten. -> Von größter Bedeutung ist hierbei die Frage, welche Außenkriterien gewählt werden.Die Auswahl sollte gut begründet und nachvollziehbar sein.
  • Kriteriumsvalidität: außenkriterien können... wie sein? (Stichwort: zeit) - zeitlich parallel (übereinstimmungsvalidität)- sich auf zukünftige ausprägungen des merkmals beziehen (prognostische validität)
  • wie berechnet man die kriteriumsvalidität? (einfache formel) vâl = r(X,Y) -> berechnung der korrelation von testergebnis X mit dem außenkriterium Y
  • was ist das problem bei der berechnung der Kriteriumsvalidität und wie kann man es lösen? die validität (korrelation zwischen testergebnis und außenkriterium) wird durch die messfehler der beiden variablen verdünnt, fällt durch 2 messfehler also geringer aus als in wirklichkeit-> verdünnungsformeln
  • was ist das ziel der exploratorischen Faktorenanalyse? einem größeren Variablen-bzw. Itemsatzeine ordnende Strukturzu geben= Mit der Faktorenanalyse können Variablen gemäß ihrer korrelativen Beziehungen in voneinander unabhängige Gruppen klassifiziert werden -> verdichten von vielen einzelkorrelationen auf zugrundeliegende latente variablen
  • Wofür steht das Z i in der formalen darstellung der FA? Zi = standardisiertes Ergebnis von Item i
  • wofür steht das lamda von i,1 in der formalen darstellung der FA? L(lamda) i,1 = Ladung von Faktor 1 für Item i
  • wofür steht F1/ Fj in der formalen Darstellung der FA? F1 / Fj = Faktor 1/ Faktor von j
  • wofür steht δi * Δi in der formalen Darstellung der FA? δi∙Δi = Ladung; Itemspezifischer Faktor
  • was ist eine ladung, welche zahlen kann sie annehmen und als was ist sie interpretierbar? Ladungen, λ i,j= Korrelation des Items i mit Faktor j, i.e. ρ(Xi, Fj)= -1 ≤ λi,j ≤ 1= als (Konstrukt-) Validität des Items i für den Faktor j interpretierbar
  • wie ermittelt man das Bestimmtheitsmaß (z.b. einer Ladung λ i,1 ) und was drückt es aus? λ²i,1 als Bestimmtheitsmaß= Wie stark ist Faktor j an Item i beteiligt? = Wie gut „misst“ Item i den Faktor j -> ERKLÄRTER VARIANZANTEIL
  • wie berechne ich die korrelation zweier (oder mehrerer) items, basierend auf den ladungen derselben auf die zugrunde liegenden faktoren? Rho (Xa, Xb) = lamdaa,1 * lamdab1 + lamdaa,2 * lamdab,2 + ... (ggf. usw.)
  • was ist die kommunalität (h² von i) der Items? h²i = wie viel der Varianz eines Items i kann durch die extrahireten Faktoren erklärt werden? h²i = summe von λ²i,j => Die Kommunalität eines Items gibt an, wie viel der Varianz eines Items durch die gemeinsamen Faktoren erklärt werden kann.
  • was ist der Eigenwert der Faktoren = Eig(Fj) ? gibt an, wie viel der gesamtvarianz der Items durch den Faktor erklärt werden kann= also summe der Ladungen eines faktors über alle items hinweg, die auf diesen faktor laden -> Mögliche Höhe der Eigenwerte ist abhängig von der Anzahl der Items (kann demnach größer als 1 sein)
  • wie berechnet man den prozentsatz der durch Faktor j erklärten Gesamtvarianz? (Eigenwert von Fj / k) * 100 k= anzahl der items
  • beschreibe die vorgehensweise der parameterschätzung in der explor. FA (= bestimmung der unbekannten ladungen und festlegung der faktorenzahl) 1. zuerst extrahiert man den faktor mit dem größten eigenwert, dadurch wird die summe der quadrierten verbleibenden korrelationen zwischen den items am mesiten minimiert2. nachdem man itterativ (=bootstrapping/ wiederholtes einsetzen falscher werte um sich an die richtigen anzunähern) die ladungen des ersten faktors geschätzt hat, wird der zweite Faktor nach dem gleichen Prinzip extrahiert, allerdings um den einfluss des ersten faktors bereinigt (also mit den restkorrelationen)3. usw,
  • nenne beide verfahren zur parameterschätzung der FA - hauptkomponentenanalyse- hauptachsenanalyse
  • wie lange extrahiert man faktoren? (stichwort restkorrelationen) bis alle restkorrelationen nahe 0 sind (> 0.2)
  • wie kann die Faktorenzahl bestimmt werden? (5 kriterien) - a priori festgelegt- extraktion und itteration bis alle restkorrelationen <.2 sind (nahe 0)- kaiser-kriterium: der eigenwert des zuletzt extrahierten faktors ist kleiner als 1- verlauf des eigenwertdiagramms (screeplot)- parallelanalyse
  • wird das eigenwertdiagramm/ screeplot zur bestimmung der faktorenzahl herangezogen, woran/ an welchem kriterium macht man die faktorenzahl fest? Bei der Betrachtung des Eigenwertediagramms, wird jene Stelle gesucht, an deren Verlauf das Eigenwertediagramm „abflacht“ (=ElbowKriterium). Die Faktoren vor dem „Knick“ werden in der weiteren Analyse berücksichtigt.
  • wie funktioniert die parallelanalyse zu bestimmung der faktorenzahl? Bei der Parallelanalyse werden zumindest 100 Datensätze von Zufallszahlen erzeugt, wobei die Anzahl an Items und der Stichprobenumfang dem empirisch gewonnenen Datensatz entspricht. All diese Datensätze werden einer Faktorenanalyse unterzogen und die aus jeder Analyse gewonnenen Eigenwerte werden pro Faktor gemittelt. Als relevante nicht triviale Faktoren werden all jene Faktoren bezeichnet, deren Eigenwerte über jenen der (gemittelten) Eigenwerte der Parallelanalyse liegen.
  • wie lautet der mathematische name der parameterschätzung der FA „Eigenwert– Eigenvektor Problem“
  • was ist die hauptkomponentenanalyse? - beliebtes verfahren zur parameterschätzung der FA- standardeinstellung in SPSS- geht davon aus, dass sich die varianz eines items vollständig durch die gemeinsamen faktoren erklären lässt (leugnet den messfehler)-> demnach sind alle kommunalitäten (und somit auch die korrelation eines items mit sich selbst) = 1
  • was ist die hauptachsenanalyse? - geht davon aus, dass sich die varianz eines items immer in die kommunalität (mit anderen items) und die einzelrestvarianz aufteilt- Demnach sind die Kommunalitäten (und somit auch die Korrelationen eines Items mit sich selbst) kleiner als 1.- ziel ist es also nur die durch die gemeinsamen faktoren erklärbare varianz zu beschreiben (Da zur beginn der datenanalyse die kommunalitäten nicht bekannt sind (kommunalitätenproblem) werden die faktoren zunächst mittels hauptkomponentenanalyse geschätzt und iterativ/ schrittweise verbessert)
  • wozu dient die faktoren/achsenrotation? wegen der vorgehensweise bei der parameterschätzung sind hohe (und damit aussagekräftige) ladungen bei der erstlösung in der praxis eher selten-> daher rotiert man die achsen und bringt sie somit näher an die items (punkte im koordinatensystem)-> ziel ist die bessere interpretierbarkeit (einfache struktur) indem möglichst jedes item auf einen faktor hoch und auf den anderen faktor niedrig läd
  • was ändert sich und was ändert sich nicht durch die achsenrotation? Durch die Rotation ändern sich:-Ladungen-Eigenwerte-möglicherweise auch die Interpretation der FaktorenUnverändert bleiben:-Kommunalitäten-der Anteil der durch die Faktoren erklärbaren Varianz