Statistik I (Fach) / Formeln und Geschissel (Lektion)
In dieser Lektion befinden sich 38 Karteikarten
Siehe oben
Diese Lektion wurde von Ayaya erstellt.
Diese Lektion ist leider nicht zum lernen freigegeben.
- z0,95 = .... z0,95 = 1,65
- z0,975 = ... z0,975 = 1,96
- χ[Quadrat]1;0,95 = ... χ21;20,95 = 3,84
- Nominalskala Als niedrigstes Skalenniveau amgesehene Art der deklarativen Vergabe von Werten. Zweck ist die Klassifikation von Dingen und die Feststellung von Un-/Gleichheit. Beispiel: Musikgenres (1=Pop, 2=Rock, 3=Soul)
- Ordinalskala Eine Form des Skalenniveaus, die dazu dient, eine Rangreihe darzustellen. Abstände der "Ränge" sind in diesem Stadium irrelevant und alle Transformationen, die die Ordnung der Rangreihe erhalten zulässig. Beispiel: Bewerberranking
- Intervallskala Höhere Stufe der Ordinalskala, in der die Abstände der Intervalle interpretierbar sind. Zulässige Transformation: y = ∝ + ßx [ß>0] Beispiel: Temperaturskalen
- Verhältnisskala Selten auftretendes Skalenniveau, das sich vor allem durch das Vorhandensein eines absoluten Nullpunkts auszeichnet. Messeinheiten sind irrelevant.y Zulässige Transformation: y = ßx [ß>0] Beispiel: Länge (y1/y2 = 3 → 1 ist dreimal so lang wie 2)
- Mittelwert Bezeichnet ein Maß, dass den Durchschnitt einer Gruppe von n Ereignissen wiedergibt. Stark anfällig für Ausreißer und repräsentiert so bei zu starken Ausreißern nicht mehr das Mittelfeld. Formel: x(Strich) = 1/n • ∑xi Lineare Transformation: y (Strich) = a + bx(Strich)
- Median Bezeichnet den Wert, unter den 50% aller Werte fallen und wird auch als "Mittlerer Wert" bezeichnet. Ist im Gegensatz zum Mittelwert robust gegenüber Ausreißern. Formel: Wenn n gerade: Median = xn/2+x(n/2)+1 / 2 Wenn n ungerade: Median = x(n+1)/2
- Modalwert Am häufigsten vorkommender Wert einer Urliste (Nicht immer eindeutig)
- Varianz ∑(xi-x(Strich)) / n - 1 = s2 Maß der Stärke der Streuung
- Standardabweichung Formel: √s2 Im Gegensatz zur Varianz bleibt die Einheit der vorherigen Werte erhalten.
- z-Wert (+ Wichtige z-Werte) Gibt an, um wie viele Standardabweichungen ein Wert vom Mittelwert entfernt liegt. Formel: z = x - x- / s Wichtige z-Werte: z0,95 = 1,65 | z0,975 = 1,96
- Stängel-Blatt-Diagramm Methode zur einfachsten Darstellung einer Merkmalsverteilung. Hierzu werden Rohdaten unterteilt und deren Häufigkeit im Intervall festgestellt. Beispiel: 5 | 6 | 245898 | 7 | 023556897 | 8 | 014446712 | 9 | 02335556788917 | 10 | 0123333566678899915 | 11 | 00122233466899913 | 12 | 01223445678897 | 13 | 11456796 | 14 | 023468 148
- Boxplot Möglichkeit zur Darstellung einer Merkmalsverteilung. Wird defininiert durch eine "Box", die die mittleren 50% der Verteilung abdeckt, und nach außen ragende so genannte "Whiskers". Position und Form der Box wird durch den Median und die Angelpunkte Q1 und Q3 bestimmt, während Whiskers in 1,5-facher Länge des IQR [Differenz Q1/Q3; Quasi Länge der Box] von den Grenzen der Box davonragen. Alle Werte, die außerhalb dieser Whisker liegen, werden als Ausreißer bezeichnet.
- Einfache Zufallsstichprobe Teilmenge der Grundgesamtheit (ohne Zurücklegen, gleiche Wahrscheinlichkeit auf große Teilmengen)
-
- Klumpenstichprobe Beispiel: Familie, Betrieb
- Geschichtete Stichprobe Aufteilung der Population in Schichten. Stichproben werden aus einzelnen Schichten erhoben. Beispiel: Wahlprognose
- Erwartungswert µ = ∑xi pi Beispiel (Würfel): 1 x 1/6 + 2 x 1/6 +(...) + 6 x 1/6 = 3,5
- Varianz (Stichprobenverteilung) σ2 = ∑(xi - µ)2 pi Beispiel (Würfel): σ2 = (1 - 3,5)2 x 1/6 + (...) + (6 - 3,5)2 x 1/6 = 35/12
- Standardfehler des Mittels Bezeichnet die Standardabweichung des Mittelwerts vom erwarteten Wert. σx(Strich) = σ / √n bzw. (Varianz) σ2x(Strich) = σ2 / n
- Zentrales Grenzwerttheorem Sagt aus, dass die Mittelwerte von Stichproben sich mit wachsendem Umfang (n) immer mehr einer Normalverteilung annähern. Die nötige Größe von n hängt hierbei von der Rohwertverteilung ab (stärkere Abweichung von Normalverteilung = mehr n nötig). → Empfehlung: n = 30
- Konsistenz von Parameterschätzern Der Schätzer eines Parameters wird als konsistent bezeichnet, wenn der Schätzer sch mit zunehmendem Stichrobenumfang verbessert.
- Erwartungstreue Beinhaltet auch Fairness. Bezeichnet die Tatsache, dass eine Abweichung nach unten vom geschätzten Mittelwert genauso wahrscheinlich ist, wie eine Abweichung nach oben.
- Methode der kleinsten Quadrate ∑i (xi - a) → Min
- Maximum-Likelihood-Prinzip Bestimmung unbekannter Wahrscheinlichkeiten anhand beobachteter Daten. → Schätze Parameter so, dass Wahrscheinlichkeit für das Auftreten der beobachteten Daten maximal wird.
- Konfidenzintervall Wertebereich, in dem sich der wahre Wert eines Schätzers mit bestimmter Wahrscheinlichkeit (für gewöhnlich 95%) befindet. → Formel: Grenzen = x(Strich) ± z1 - α/2 σx(Strich)
- p-Wert Die Wahrscheinlichkeit, dass das ermittelte oder ein extremeres Ergebnis unter Gültigkeit von H0 eintritt. → Ergibt sich aus Messwerten, nicht selbst festgelegt
- Signifikanzniveau Die vom Forscher festgelegte Wahrscheinlichkeit, mit der die Ablehnung der Nullhypothese zu einem Fehler erster Art führt.
- Teststärke Ist definiert als 1 - β (← Fehler zweiter Art) und damit die Wahrscheinlichkeit einer richtigen Entscheidung bei Ablehnung der H0.
- Effektgröße Bezeichnet die Größe eines Effekts und wird durch 𝛿 (Cohens) angegeben. Ein Wert von 1,0 bezeichnet hierbei einer Abweichung, die genau einer Standardabweichung entspricht. Formel: 𝛿 = 𝜇−𝜇0 / 𝜎 Konventionen: 0,2 = Kleiner Effekt | 0,5 = Mittelgroßer Effekt | 0,8 = Großer Effekt
- t-Test für eine Stichprobe → n-1 Freiheitsgrade → Formel: t = √n • (x(Strich) - µ0 / s ) → Grenzen Konfidenzintervall: x(Strich) ± tdf;1 - α/2 • s/√n → Voraussetzungen: Daten aus einer Stichprobe, Merkmal in Population normalverteilt
-
- t-Test für zwei unabhängige Stichproben Häufigststes Rechenmodell für Stuff. Formeln extrem komplex und irrelevant für Klausur. → Freiheitsgrade: df = (n1-1) + (n2-1) → Voraussetzungen: Natürlich vorliegende Gruppen/Zufällige Zuordnung
- t-Test für Beobachtungspaare → Voraussetzungen: Normalverteilte Differenzwerte, Beobachtungspaare in Zufallsstichprobe → Freiheitsgrade: df = n-1 → Formel: t = √n ¯d/sd
- Kovarianz Von Messeinheiten beider Messwerte abhängig und deswegen zur Kennzeichnung der Enge eines Zusammenhangs wenig geeignet. → Formel: sxy= ∑ni=1 (xi - x(Strich)) (yi - y(Strich)) / n - 1
- ? - Unabhängigkeitstest Testet, ob zwei Variablen voneinander unabhängig sind. → Prüfgröße: 𝜒2 = ∑Zellen • ((Beo-Erw)2 / Erw)
- Homomorph Strukturerhaltend
- Steigung (Regression) Formel: b = sxy / sx2