Statistik I (Fach) / Formeln und Geschissel (Lektion)

In dieser Lektion befinden sich 38 Karteikarten

Siehe oben

Diese Lektion wurde von Ayaya erstellt.

Lektion lernen

Diese Lektion ist leider nicht zum lernen freigegeben.

  • z0,95 = .... z0,95 = 1,65
  • z0,975 = ... z0,975 = 1,96
  • χ[Quadrat]1;0,95 = ... χ21;20,95 = 3,84
  • Nominalskala Als niedrigstes Skalenniveau amgesehene Art der deklarativen Vergabe von Werten. Zweck ist die Klassifikation von Dingen und die Feststellung von Un-/Gleichheit.  Beispiel: Musikgenres (1=Pop, 2=Rock, 3=Soul)
  • Ordinalskala Eine Form des Skalenniveaus, die dazu dient, eine Rangreihe darzustellen. Abstände der "Ränge" sind in diesem Stadium irrelevant und alle Transformationen, die die Ordnung der Rangreihe erhalten zulässig. Beispiel: Bewerberranking
  • Intervallskala Höhere Stufe der Ordinalskala, in der die Abstände der Intervalle interpretierbar sind. Zulässige Transformation: y = ∝ + ßx    [ß>0]  Beispiel: Temperaturskalen 
  • Verhältnisskala Selten auftretendes Skalenniveau, das sich vor allem durch das Vorhandensein eines absoluten Nullpunkts auszeichnet. Messeinheiten sind irrelevant.y Zulässige Transformation: y = ßx [ß>0] Beispiel: Länge (y1/y2 = 3 → 1 ist dreimal so lang wie 2)
  • Mittelwert Bezeichnet ein Maß, dass den Durchschnitt einer Gruppe von n Ereignissen wiedergibt. Stark anfällig für Ausreißer und repräsentiert so bei zu starken Ausreißern nicht mehr das Mittelfeld. Formel:  x(Strich) = 1/n • ∑xi  Lineare Transformation: y (Strich) = a + bx(Strich) 
  • Median Bezeichnet den Wert, unter den 50% aller Werte fallen und wird auch als "Mittlerer Wert" bezeichnet. Ist im Gegensatz zum Mittelwert robust gegenüber Ausreißern. Formel:  Wenn n gerade: Median = xn/2+x(n/2)+1 / 2 Wenn n ungerade: Median = x(n+1)/2
  • Modalwert Am häufigsten vorkommender Wert einer Urliste (Nicht immer eindeutig)
  • Varianz ∑(xi-x(Strich)) / n - 1 = s2 Maß der Stärke der Streuung
  • Standardabweichung Formel: √s2 Im Gegensatz zur Varianz bleibt die Einheit der vorherigen Werte erhalten. 
  • z-Wert (+ Wichtige z-Werte) Gibt an, um wie viele Standardabweichungen ein Wert vom Mittelwert entfernt liegt. Formel: z = x - x- / s Wichtige z-Werte: z0,95 = 1,65 | z0,975 = 1,96
  • Stängel-Blatt-Diagramm Methode zur einfachsten Darstellung einer Merkmalsverteilung. Hierzu werden Rohdaten unterteilt und deren Häufigkeit im Intervall festgestellt.  Beispiel:  5     |  6  | 245898     |  7  | 023556897     |  8  | 014446712   |  9  | 02335556788917   | 10 | 0123333566678899915   | 11 | 00122233466899913   | 12 | 01223445678897     | 13 | 11456796     | 14 | 023468 148
  • Boxplot Möglichkeit zur Darstellung einer Merkmalsverteilung. Wird defininiert durch eine "Box", die die mittleren 50% der Verteilung abdeckt, und nach außen ragende so genannte "Whiskers". Position und Form der Box wird durch den Median und die Angelpunkte Q1 und Q3 bestimmt, während Whiskers in 1,5-facher Länge des IQR [Differenz Q1/Q3; Quasi Länge der Box] von den Grenzen der Box davonragen. Alle Werte, die außerhalb dieser Whisker liegen, werden als Ausreißer bezeichnet.
  • Einfache Zufallsstichprobe Teilmenge der Grundgesamtheit (ohne Zurücklegen, gleiche Wahrscheinlichkeit auf große Teilmengen)
  • Klumpenstichprobe Beispiel: Familie, Betrieb
  • Geschichtete Stichprobe Aufteilung der Population in Schichten. Stichproben werden aus einzelnen Schichten erhoben. Beispiel: Wahlprognose
  • Erwartungswert µ = ∑xi pi Beispiel (Würfel): 1 x 1/6 + 2 x 1/6 +(...) + 6 x 1/6 = 3,5
  • Varianz (Stichprobenverteilung) σ2 = ∑(xi - µ)2 pi  Beispiel (Würfel): σ2 = (1 - 3,5)2 x 1/6 + (...) + (6 - 3,5)2 x 1/6 = 35/12
  • Standardfehler des Mittels Bezeichnet die Standardabweichung des Mittelwerts vom erwarteten Wert. σx(Strich) = σ / √n  bzw. (Varianz) σ2x(Strich) = σ2 / n
  • Zentrales Grenzwerttheorem Sagt aus, dass die Mittelwerte von Stichproben sich mit wachsendem Umfang (n) immer mehr einer Normalverteilung annähern. Die nötige Größe von n hängt hierbei von der Rohwertverteilung ab (stärkere Abweichung von Normalverteilung = mehr n nötig). → Empfehlung: n = 30
  • Konsistenz von Parameterschätzern Der Schätzer eines Parameters wird als konsistent bezeichnet, wenn der Schätzer sch mit zunehmendem Stichrobenumfang verbessert.
  • Erwartungstreue Beinhaltet auch Fairness. Bezeichnet die Tatsache, dass eine Abweichung nach unten vom geschätzten Mittelwert genauso wahrscheinlich ist, wie eine Abweichung nach oben.
  • Methode der kleinsten Quadrate ∑i (xi - a) → Min
  • Maximum-Likelihood-Prinzip Bestimmung unbekannter Wahrscheinlichkeiten anhand beobachteter Daten. →  Schätze Parameter so, dass Wahrscheinlichkeit für das Auftreten der beobachteten Daten maximal wird. 
  • Konfidenzintervall Wertebereich, in dem sich der wahre Wert eines Schätzers mit bestimmter Wahrscheinlichkeit (für gewöhnlich 95%) befindet.  → Formel: Grenzen = x(Strich) ± z1 - α/2 σx(Strich)
  • p-Wert Die Wahrscheinlichkeit, dass das ermittelte oder ein extremeres Ergebnis unter Gültigkeit von H0 eintritt. → Ergibt sich aus Messwerten, nicht selbst festgelegt
  • Signifikanzniveau Die vom Forscher festgelegte Wahrscheinlichkeit, mit der die Ablehnung der Nullhypothese zu einem Fehler erster Art führt. 
  • Teststärke Ist definiert als 1 - β (← Fehler zweiter Art) und damit die Wahrscheinlichkeit einer richtigen Entscheidung bei Ablehnung der H0.
  • Effektgröße Bezeichnet die Größe eines Effekts und wird durch 𝛿 (Cohens) angegeben. Ein Wert von 1,0 bezeichnet hierbei einer Abweichung, die genau einer Standardabweichung entspricht. Formel: 𝛿 = 𝜇−𝜇0 / 𝜎 Konventionen: 0,2 = Kleiner Effekt | 0,5 = Mittelgroßer Effekt | 0,8 = Großer Effekt
  • t-Test für eine Stichprobe → n-1 Freiheitsgrade → Formel: t = √n • (x(Strich) - µ0 / s ) → Grenzen Konfidenzintervall: x(Strich) ± tdf;1 - α/2 • s/√n → Voraussetzungen: Daten aus einer Stichprobe, Merkmal in Population normalverteilt
  • t-Test für zwei unabhängige Stichproben Häufigststes Rechenmodell für Stuff. Formeln extrem komplex und irrelevant für Klausur. → Freiheitsgrade: df = (n1-1) + (n2-1) → Voraussetzungen: Natürlich vorliegende Gruppen/Zufällige Zuordnung 
  • t-Test für Beobachtungspaare → Voraussetzungen: Normalverteilte Differenzwerte, Beobachtungspaare in Zufallsstichprobe → Freiheitsgrade: df = n-1 → Formel: t = √n ¯d/sd
  • Kovarianz Von Messeinheiten beider Messwerte abhängig und deswegen zur Kennzeichnung der Enge eines Zusammenhangs wenig geeignet. → Formel: sxy= ∑ni=1 (xi - x(Strich)) (yi - y(Strich)) / n - 1
  • ? - Unabhängigkeitstest Testet, ob zwei Variablen voneinander unabhängig sind.  → Prüfgröße: 𝜒2 = ∑Zellen • ((Beo-Erw)2 / Erw)
  • Homomorph Strukturerhaltend
  • Steigung (Regression) Formel: b = sxy / sx2