Statistik 1 (Subject) / 18.04. (Lesson)
There are 46 cards in this lesson
18.04.
This lesson was created by Laura_Henc.
This lesson is not released for learning.
- Zwischen welchen Skalenniveaus entscheidet man? - Nominalskala - Ordinalskala - Intervallskala - Verhältnisskala
- Was ist die Nominalskala? Zahl zuordnen: 1 für männlich, 2 für weiblich
- Was ist die Ordinalskala? - besser, länger, mehr -> Zahl muss dann auch größer oder kleiner sein - Rang
- Was ist die Intervallskala? - Verhältnisse von Differenzen - man kann aber nicht doppelt so, halb so etc sagen - Beispiel: Geburtsjahr
- Was ist die Verhältnisskala? - etwas ist doppelt oder dreimal so sehr dann muss auch die Zahl doppelt oder dreifach sein
- Wie bezeichnet man die Intervall- und Verhältnisskala zusammengefasst und wie die Nominal- und Ordinalskala? - Intervall- und Verhältnisskala: Kardinalskala - Nominal- und Ordinalskala: kategorial
- Zwischen welchen Häufigkeiten unterscheidet man? absolute & relative Häufigkeit
- Was ist die absolute und was die relative Häufigkeit? Erkläre an einer Strichliste. - absolute Häufigkeit: 50 - relative Häufigkeit: 0,50
- Zwischen welchen Darstellungsdiagrammen unterscheidet man? Wie sieht jedes aus? - Stabdiagramm: wie Balken - Histogramm: Balken, die hoch und runter, ziemlich gemischt gehen - Tortendiagramm - Polygonzug: wie ein Berg aufgebaut, er immer flacher wird
- Was sind Kategoriensysteme und wozu braucht man sie? - Liste erstellen welche Werte wie häufig vorkommen - braucht man als Vorschritt, um Häufigkeiten im Histogramm darzustellen
- Zwischen welchen Skalen unterscheidet man? - diskrete Skalen - kontinuierliche Skalen
- Was sind diskrete Skalen? - abzählbar (endlich oder unendlich) - alle Daten auf Ordinal- und Nominalskala
- Was sind kontinuierliche Skalen? - überabzählbar unendlich - Bsp: Körpergröße oder Gewicht
- Erkläre Rohdaten und Transformierte Werte an einem Beispiel. - Rohdaten: gefahrene km und getankte Liter - Transformierte Werte: Verbrauch Liter pro 100 km
- Welche Diagramme benutzt man am besten für die Nominalskala? Tortendiagramme, Bar-charts
- Welche Diagramme benutzt man am besten für die Ordinalskala? Stabdiagramm
-
- Welche Diagramme benutzt man am besten für die Verhältnis- und die Intervallskala? Histogramme, Polygone
- Was gibt die Verteilung an? gibt den prozentualen Anteil jeder Kategorie an
- Was gibt die Verteilungsfunktion an? wie viele Fälle jeweils unter einem bestimmten Wert liegen
- Worauf steigt die Verteilungsfunktion monoton? - auf 1 bei relativen Häufigkeiten - auf 100 bei Prozentwerten - auf N bei absoluten Häufigkeiten
- Wobei hilft das Summenzeichen? Abkürzung für Additionen mit vielen Summanden
- Wozu benutzt man Kennwerte? - Charakterisierung des Schwerpunkts der Daten - Chrakterisierung der Diffusion in den Daten
- Was ist der Modus und wann ist er sinnvoll? - der häufigste Wert - sinnvoll ab Nominalskalenniveau
- Was ist der Modus in einem Histogramm oder Polygonzug? - das Maximum der Verteilung - es gibt auch bimodale und trimodale Verteilungen (der häufigste Wert tritt in 2, 3 Kategorien auf) - sind diese Kategorien benachbart, ist es eine breitgipflige Verteilung
- Was ist der Median und wann ist er sinnvoll? - der Wert, über dem 50% der Fälle und unter dem 50% der Fälle liegen - sinnvoll ab Ordinalskalenniveau
- Wozu ist das arithmetische Mittel da und welche Eigenschaften hat es? - Summe der Werte dividiert durch Anzahl der Werte - Nulleigenschaft - Minimumseigenschaft - Ersatzeigenschaft des arithmetischen Mittels
- Ab wann ist die Berechnung des arithmetischen Mittels sinnvoll? ab Intervallskalenniveau
- Was ist ein Spezialfall des arithmetischen Mittels? - das Gewogene Arithmetische Mittel (GAM)
- Was ist das geometrische Mittel und ab wann ist es sinnvoll? -- n-te Wurzel aus dem Produkt aller Werte -um den Mittelwert aus prozentualen Zuwächsen zu errechnen - - sinnvoll ab Verhältnisskalenniveau
- Gebe die allgemeine Formel für Zuwachsfaktoren und am Beispiel um 2% zunehmen. - wenn etwas um i*100% zunimmt, dann ist der Zuwachsfaktor 1+i - wenn etwas um 2% (2/100) zunimmt, ist der Zuwachsfaktor 1,02
- Was ist der Rang und ab wann ist er sinnvoll? - Angabe des größten und kleinsten Wertes -> Charakterisierung hinsichtlich der Diffusion - man gibt dabei die Variationsbreite = den Rang einer Verteilung an - sinnvoll ab Ordinalskalenniveau
- Was ist der Interdezilbereich, der Interquartilbereich und der mittlere Quartilabstand? Ab wann sind diese Dinge sinnvoll? - Streubereich der mittleren 80% einer Verteilung = Bereich zwischen P10 und P90 - Bereich zwischen P25 und P75 - (Q3-Q1)/2 - ab Ordinalskalenniveau
-
- Wann ist die Berechnung der Varianz und der Standardabweichung sinnvoll? ab Intervallskalenniveau
- Wie errechnet man den Standardfehler? Standardabweichung nochmals durch Wurzel aus n divideren
- Warum sind die Varianz und die Standardabweichung wichtig in der Statistik? weil die Normalverteilung durch den Mittelwert und die Standardabweichung vollständig bestimmt ist
- Was hat die Standardnormalverteilung für einen Mittelwert und eine Streuung? - Mittelwert: 0 - Streuung: 1
- Zwischen welchen Verteilungen unterscheidet man? - symmetrisch: artihmetisches Mittel, Median, Modus sind gleich - linkssteil/rechtsschief: Modus kleiner als Median, Median kleiner als arithmetisches Mittel - rechtssteil/linksschief: Modus größer als Median, Median größer als arithmetisches Mittel
- Was ist der Exzess und was ist der Fall wenn der Exzess kleiner oder größer 0 ist? - charakterisiert die Verteilung bzgl der Nähe der Wendepunkte zum Maximum der Verteilung - Exzess > 0: eine Verteilung, die im Vergleich zur Normalverteilung mehr Masse im Bereich um den Mittelwert hat - Exzess < 0: die Verteilung hat im Vergleich zur Normalverteilung nach außen hin mehr Masse
- Wie kann man Datensätze graphisch darstellen? - Box-Plot - Fehlerbalkendiagramm - bivariates Streuungsdiagramm
- Was zeigt der Box-Plot und ab wann ist er sinnvoll? - Median und Interquartilabstand - ab Ordinalskalenniveau
- Was ist ein Fehlerbalkendiagramm und ab wann ist es sinnvoll? - bei denenn der Mittelwert als Punkt und der Standardfehler als Balken angegeben ist - ab Intervallskalenniveau
- Wozu benutzt man bivariate Streuungsdiagramme? - Wenn eine mindestens intervallskalierte x-Variable und eine mindestens intervallskalierte y-Variable zusammen dargestellt werden sollen
- Was ist die Korrelation und welchen Wert kann der Korrelationskoeffizient annehmen? - Erfassen der Stärke eines linearen Zusammenhangs zwischen 2 Variablen - Korrelationskoeffizient zwischen -1 und +1
- Was besteht für ein Zusammenhang wenn die Korrelation +1, -1 oder 0 ist? +1: vollkommen linearer Zusammenhang zwischen einer Variablen x und einer Variablen y, Gerade hat positive Steigung - -1: vollkommen linearer Zusammenhang zwischen einer Variablen x und einer Variablen y, Gerade hat negative Steigung - 0: kein linearer Zusammenhang zwischen einer Variablen x und einer Variablen y
- Was passiert, je näher der Korrelationskoeffizient bei +1 oder -1 liegt? umso näher schmiegt sich die Punktwolke an die Gerade
- Was passiert, je näher der Korrelationskoeffizient bei 0 liegt? umso weiter streut die Punktwolke von der Geraden weg