Statistik I (Fach) / Deskriptive Statistik (Lektion)
In dieser Lektion befinden sich 9 Karteikarten
Varianz Mittelwerte Median Etc
Diese Lektion wurde von Glonie erstellt.
- Nominalskala - Objekte werden hinsichtlich einer Variablen in Kategorien (Klassen) eingeteilt und den Katergorien eineindeutig Zahlen zugeordnet. man verwendet die Zahlen "nur" um die Kategorien zu unterscheiden - Bsp.: Geschlecht: 1= weiblich, 2= männlich, 3= divers; Blutgruppe, Studienfach etc. - Zulässige Transformationen: eineindeutige Transformation: Man kann die Zahlenzuordnung beliebig ändern, sie muss nur eineindeutig bleiben (alle höheren Transformationen sind auch bei Nominalskala anwendbar) - Deutbarkeit: Zahlen gleich oder ungleich - Zulässige Statistiken: Häufigkeiten, Prozentwerte, Modalwert
- Ordinalskala - Objekten werden Zahlen so zugeordnet, dass eine höhere Ausprägung mit den Variablen mit einer höheren Zahl versehen wird --> Rangordnung - Beispiele: Variable Schulbildung: 1= ohne Schulabschluss, 2= Hauptschulabschluss, 3= mittlere Reife, 4= Abitur ; Single-Charts, Härte von Mineralien - Zulässige Transformationen: ordinale/ ordnungserhaltende Transformation, streng monoton wachsende Abbildungen: --> die Zahlenzuordnung lässt sich beliebig ändern, nur die Reihenfolge muss erhalten bleiben - Deutbarkeit: Zahl größer, gleich oder kleiner als eine andere; Gleiche Differenzen zwischen zwei Zahlen lassen nicht auf gleiche Unterschiede in der Variablenausprägung schließen - Zulässige Statistiken: wie bei Nominalskala + kumulierte Prozentränge, Median, Rangkorrelation, Rangvarianzanalysen
- Intervallskala - Den Objekten werden hinsichtlich einer Variablen Zahlen so zugeordnetm dass gleiche Unterschiede in den Variablenausprägungen mit gleich großen Differenzen der Zahlen einhergehen. - Beispiele: Temperatur; Intelligenz-Testwerte (und Werte anderer Tests) - Voraussetzungen: Differenzen zwischen Variablenausprägungen müssen bedeutsam sein - Transformationen: Lineare Transformation: Man kann zu den Zahlen eine beliebeige Konstante addieren und die Zahlen mit einer beliebigen positiven Kostante multiplizieren;also z.B. Temperatur in Fahrenheit statt Celsius: (+ Ähnlichkeitstransformation) Grad Fahrenheit = 32 + 1.8 · Grad Celsius - Deutbarkeit: Zahlendifferenz größer, gleich bzw. kleiner einer anderen Zahlendifferenz - Man kann nicht sagen, dass eine Zahl um einen bestimmten Fsktor größer oder kleiner als eine andere ist - Nullpunkt hat keine besondere Bedeutung - Zulässige Statistiken: Ordinalskala + Mittelwert, Varianz usw.
- Verhältnisskala - wie Intervallskala und zusätzlich: bedeutsamer Nullpunkt (nichts vorhanden) - Beispiele: physikalische Größen wie Länge, Gewicht, Zeit, Geschwindigkeit; Preis - Voraussetzungen: Verhältnis von Variablenausprägungen bedeutsam und Nullpunkt existiert - Zulässige Transformationen: NUR Ähnlichkeitstransformation: Man kann die Zahlen mit einer beliebigen positiven Konstante multiplizieren - Deutbarkeit: Zahl gleich bzw. um einen bestimmten Faktor größer oder kleiner als eine andere (-> Verhältnis zwischen Zahlen deutbar); Man kann nicht sagen, dass eine Zahl einen bestimmten absoluten Wert hat - Zulässige Statistiken: wie bei Intervallskala + Variations- und Kongruenzkoeffizient
- Arithmetischer Mittelwert - hängt von allen Messwerten ab (--> reagiert empfindlich auf Ausreißer) - muss als Messwert gar nicht auftreten - additive Konstante zu allen Messwerten --> Mittelwert vergrößert sich um ebendiese Zahl, d.h. wenn y = xi + a für alle i, dann ist ȳ= X̅ + a - multiplikative Konstante zu allen Messwerten --> neuer Mittelwert, indem man alten Mittelwert mit ebendieser Zahl multipliziert, d.h yi = b · xi für alle i, dann ist ȳ = b · X̅ - Summe der Abweichungen aller Messwerte vom Mittelwert ergibt 0 - Die Summe der quadrierten Abweichungen aller Messwerte vom Mittelwert ist ein Minimum, d.h. es gibt keinen anderen Kennwert, bei dem diese kleiner sind
- Modalwert Der Wert, der bei einer Verteilung am häufigsten vorkommt. Um ihn sinnvoll deuten zu können, muss die Variable nur min. nominalskaliert sein. Problem bei feinen Abstufungen (bei stetigen Variablen der Fall), da dann im Extremfall jeder Wert nur einmal vorkommt ; Lösung: sekundäre Häufigkeitsverteilungen - wenn mehrere Werte gleich häufig vorkommen (z.B. bimodale symmetrische Verteilung), ist der Modalwert nicht bestimmbar
- Median - Zerlegt die Messwerte in zwei gleich große Teile, d.h. min. 50% der Werte sind kleinergleich und min. 50% sind größergleich dem Median - erfordert min. Ordinalskalenniveau - Vorgehensweise: 1. Messwerte austeigend sortieren 2. - falls n ungerade ist, ist der Median in der Mitte der Rangordnung, also: x(n+1/2) - falls n gerade ist, ist der Median der Mittelwert zwischen den beiden in der Mitte der Rangordnung ligenden Werten, also: Md= (x(n/2)+x(n/2+1)) / 2 Eigenschaften: - er hängt nicht von allen Messwerten ab (reagiert also nicht empfindlich auf Ausreißer) - Die Summe der absoluten Abweichungen aller Werte vom Median ist ein Minimum, also: Σ l xi - Md l = min
- Varianz s² - Maß für die Variabilität der Messwerte (bei min. Intervallskalenniveau) - Abweichungen vom Mittelwert werden zunächst quadriert und dann summiert (und dann durch n-1 geteilt) - ein Streuungsmaß, welches die Verteilung von Werten um den Mittelwert kennzeichnet - das Quadrat der Standardabweichung - Eigenschaften: - hängt von allen Messwerten ab - sind alle Messwerte gleich, besteht also keine Variabilität, ist die Varianz = 0 --> je größer die Variabilität (also die Abweichungen vom Mittelwert), desto größer wird s2 - Durch das Quadrieren fallen Abweichungen (z.B. Ausreißer) überproportional ins Gewicht - Durch das Quadrieren weist die Varianz nicht mehr die Einheiten der Messwerte auf - Messwerte mit additiver Konstante: Varianz verändert sich nicht (--> ist invariant gegenüber additiven Konstanten); sie verschiebt sich bloß um z.B. +1 auf der x-Achse), also: wenn y = xi + a, dann ist sy2 = sx2 - Messwerte mit multiplikativer Konstante b multipliziert: Varianz verändert sich um den Faktor b2 : Wenn y = b · xi , dann ist sy2 = b2 · sx2
- Standardabweichung s - Wurzel aus der Varianz s2 - Eigenschaften: - same as Varianz bis auf zwei Unterschiede: - s weist durch das Wurzelziehen wieder die Einheiten der Messwerte auf - werden die Messwerte mit einer Konstanten b multipliziert, so verändert sich die Standardabweichung um den Faktor b, also wenn yi = b · x , dann ist sy = b · sx