Statistik 1 (Fach) / Bivariate deskriptive Statistik (Lektion)

In dieser Lektion befinden sich 28 Karteikarten

Bivariate deskriptive Statistik

Diese Lektion wurde von gimleeundgrace erstellt.

Lektion lernen

Diese Lektion ist leider nicht zum lernen freigegeben.

  • Welche Standardisierungen gibt es? IQ = 100 + 15zZ = 100 + 10zT = 50 + 10zPisa = 500 + 100zSchulnote = 3 -zAbinote  = 8+3zStanine = 5 +2z
  • Warum standardisiert man Variablen - Um Angaben zur relativen Lage von Messwerten in einer Verteilung machen zu können. Das heißt man bestimmt wieviele Standardabweichungen der interessierende Messwert vom Mittelwert entfernt liegt. zi = yi- y(mittelwert)/ sy - Und man kann Werte mit unterschiedlichen Einheiten Vergleich z.b kg und m - und ein messwert kann im hinblick auf verschiedene populationen standardisiert werden,, um AUskunft über seine relatitve position in unterschiedlichen Populationen zu erhalten.
  • Welche Eigenschaften hat die Standardnormalverteilung Die Standardnormalverteilung ist die Normalverteilung für die z-Werte mit dem Mittelwert 0 und der Standardabweichung 1 -standardisierte normalverteilte Variablen haben immer die gleiche Verteilungsform- Die Fläche unter der STandardnormalverteilung bis zu einem bestimmten WErt ist das Perzentil - Prozentrang . p = F(y) = siehe skript tabelle siehe skript
  • Was geben z-Werte an WIeviele Standardabweichungen ein Wert vom Mittelwert entfernt ist.
  • Die Normalverteilung- stetig oder diskret, weitere Eigenschaften stetig, auch genannt gaußsche Verteilung, dichtefunktion form einer glocke Der Erwartungswert der Normalverteilung ist glelich dem median, also 50%Quartil
  • Was sind boxplots Boxplots sind grafische verfahren zur identifikazion von Ausreißer und extremen werten, ebenso zur Abschätzung der lage, streuung und chiefe
  • was ist eine kontigenztabelle eine bivariate häufigkeitstabelle nennt man auch kontingenztabelle.  Es geht um den zusammenhang zweier Variablen z.b. geschlecht und englischnote.
  • Woraus bestehen bedingte Häufigkeitsverteilungen Die bedingten Häufigkeitsverteilungen bestehen aus den bedingten Häufigkeiten. Das heißt den relativen Häufigkeiten einer Variablen, unter der Bedingung dass die andere Variable eine bestimmte Ausprägung besitzt.
  • Wie wird die Berechnung der bedingten Häufigkeitsverteilung, also der bdingten Häufigkeitsverteilung für die Englischnote gegeben die beiden Ausprägungen der Variablen Geschlecht. Man teilt die absoluten Häufkeiten der ersten Zeile jeweils durch die Anzahl der männlichen Probanden und alle absoluten Häufigkeiten der zweiten Zeile durch die Anzahl der weiblichen Probanden. Schauen gegeben was? dann dadurch teilen!!!Man enthält so die bedingte Häufigkeitsverteilung der Schulnoten z.B. für die Schülerinnen, was der relativen Häufigkeitsverteilung für die Variable Englischnote entsprich. (Schüler werden ausser acht gelasse!!!) Kontigenztabelle schaut so aus:                     Englischnote________________________ Geschlecht     1 2 3 4 5 Gesamt________________________mänlichweiblch________________________GEsamt
  • was ist die abhängige/unabhängige variable /zeilenvariable bzw. spaltenvariable wird eine variable (abhängige) durch eine andere variable (unabhängige) beeinflusst, so wird die abhängige als über die spalten variierende variable (spaltenvariable) festgelegt. Also schreibt man die oben hinDie Zeilenvariable ist die unabhängige Variable und steht links.
  • was sagt uns die bedingte häufigkeitsverteilung? ob ein zusammenhang zwischen  zwei variablen ist. unterscheiden sich die bedingten häufigkeitsverteilungen? geringes ausmaß: kein großer unterschied zwischen zwei Variablen.
  • in einem streudiagramm - wie ist die achsenbeschriftung bei unabhängigen/abhängigen Variablen unabhängige variable mit x-achse, abhängige mit y-achse
  • Die Korrelation maß für lineare zusammenhänge rxy = sxy/sxsy -sxy ist kovarianz, -andere namen: produkt-moment-korelationskoeffizient, pearsonscher korrelationskoeffizient- ist normiert zwischen -1 und +1 - wenn rxy = 1 alle punkte auf einer Geraden mit positiver Steigung- wenn rxy = 0 lineare unabhängigkeit. - korrelation ist positiv bei gleichsinnigem linearem zusammenhang- je stärker der zusammenhang desto größer der betrag der korrleation
  • Fehler bei der korrelation a) Ein Fehler kann bei der Einschätzung gemacht werden, ab wann ein Korrelationskoeffizient als hoch bzw. niedrig gilt. Die Bewertung sollte deshalb immer unter Beachtung der inhaltlichen Thematik erfolgen. Auch durch die Falscheinschätzung der Ergebnisse können Fehler gemacht werden. Es sollte darauf geachtet werden ob die Zusammenhänge auch wirklich linear sind. c) aus einer Korrelation zwischen zwei Variablen kann nicht gefolgert werden, dass ein kausaler Zusammenhang zwischen den beiden besteht. Bsp. positive Korrelation zwischen Wortschatz und Schuhgröße. b) Es wird nicht der reine Effekt eines Merkmals auf ein Kriterium erhoben, sondern der gemeinsame Einfluss zweier Merkmale. Das heißt, dass der Zusammenhang von zwei Merkmalen betrachtet wird, aber der Einfluss weiterer Merkmale nicht. Ein weiteres Merkmal wäre in unserem Beispiel das Geschlecht. Häufig liegt in vielen Fällen eine komplexe Situation mit mehreren Drittvariablen vor. Deshalb sollte man eine differenzierte statistische Analyse machen.
  • warum kann man die produkt-moment-korrelation nicht für ordinalskalierte varialben hernehmen. man kann diese varialben nur der größe nach ordnen, abstände sind nicht definiert. Die Werte halten durch die Sortierung Ränge.
  • WAs ist die Rangkorrelation nach Spearman Ist ein Maß für den Zusammenhang ordinalskalierter Variablen. Sie entspricht der Produkt-Moment-Korrelation der Ränge zweier Variablen.  Sie misst den Grad eines monotonen Zusammenhangs zwischen zwei ursprünglichen variablen. = 0 wenn unabhängigkeit zwischen den Rängen. + wenn ein gleichsinniger zusammenhang bestehtje größer der Zusammenhang desto größer der Betrag normiert -1 +1im gegensatzu zur korrelation robust gegenüber ausreißern. da keline Abstände beachtet werden.
  • Welche zusammenhangmaße gibt es für ordinalskalierte variablen pearsonsche rangkorrelation, verfahren die auf diskordanz/konkordanz beruhen wie gamma, tau b, tau c,
  • Wie funktioniert das Verfahren der Konkordanz/Diskordanz paarweiser vergleich von zwei statistischen einheiten hinsichtilich der werte der beiden zu korreliernder Variable. Es müssen ke ien ABstände definiert werden.
  • was sind konkordante paare xi kleiner xj und yi kleiner yjxi größer xj und yi größer yj
  • Gamma Godmann-kruskal gamma bei nur konkordanten paaren gamma = 1bei nur diskordanten paaren  gamme = -1=0 wenn Anzahl diskordanter = Konkordanter paareACHTUNG: RANGBINDUNGEN WERDEN IGNORIERTda gamma in diesem Fall den zusammenhang in einem nicht geringen Ausma0 überschätzen kann.(also gamma fällt unangemessen hoch aus.)
  • tau b tau b berücksichtigt bindungenTxy werden nicht berücksichtigt da sie nichts über den zusammenhang aussagen.  ABer: WENN DIE ANZAHL UNTERSCHIEDLICHER AUSPRÜGUNGEN VON X UND Y NICHT GLEICH IST. -> keine Werte 1 bzw. -1
  • Tau c Alternative zu Tau b. normiert -1 udn +1 Randverteilungen der Varialben müssen homogen sein.
  • Wie bestimmt man ein zusammenhangmaß für nominalskalierte variablen Aus einer Kontigenztabelle eine Indifferenztabelle erstellen.Aus der Indifferenztabelle mit X2 Zusammmenhang berechnen.
  • WAs ist eine Indifferenztabelle Die Indiefferenztabelle enthält die selben Randverteilungen wie die Kontigenztabelle, die bedingten Häufigkeitsverteilungen identisch. Die Variablen in der Indifferenztabelle sind unabhängig.
  • Eigenschaften X2 - nicht normiert, Minimum = 0, Maximum abhängig vom Stichprobenumfang und Anzahl der Zeilen und Spalten der Kontigenztabelle (0 - unendlich) - je größer X2  umso mehr unterscheiden sich die bedingten Häufigkeitenverteilungen - keine Richtung des Zusammenhang (positiv oder negativ)
  • Warum benötigt man Zusammenhangmaße für die Übereinstimmung von Urteilen Dadurch kann die Übereinstimmung von Urteilen bestimmen um deren Zuverlässigkeit abzuschätzen.
  • Cohens K Ein Zusammenhangmaß für die die Übereinstimmung von Urteilen.K = Pa-Pc/ 1-Pc Anzahl übereinstimmender Urteile:Pa = 1/n Summe nii Zufallsanteil: Pc  (Formel skript) Cohens K berücksichtigt die zufällig übereinstimmenden Urteile. - WErtebereich von -1 bis 1- =0 Anzahl der beobachteten Übereinstimmungen = der Anzahl der Urteile bei einer zufälligen Urteilsbildung - negatives K: : die anzahl der beobachteten Übereinstimmungen ist geringer als die bei zufälliger Urteilsbildung zu erwartende Anzahl von Übereinstimmungen. Wert von 0,5 Übereinstimmung nicht befriedigend
  • Unterschiedliche Skalenniveaus- welche zusammenhangmaß Intervall x Ordinal : Tau bIntervall x Nominal: polytom: eta                               dichotom: natürlich rpbis, künstilch: rbisOrdinal x Nominal: V polytom: es gibt mehr als zwei ausprägungendichotom: es gibt zwei ausprügungen