Statistik 1 (Subject) / 18.04. (Lesson)

There are 46 cards in this lesson

18.04.

This lesson was created by Laura_Henc.

Learn lesson

This lesson is not released for learning.

  • Zwischen welchen Skalenniveaus entscheidet man? - Nominalskala - Ordinalskala - Intervallskala - Verhältnisskala
  • Was ist die Nominalskala? Zahl zuordnen: 1 für männlich, 2 für weiblich
  • Was ist die Ordinalskala? - besser, länger, mehr -> Zahl muss dann auch größer oder kleiner sein - Rang
  • Was ist die Intervallskala? - Verhältnisse von Differenzen - man kann aber nicht doppelt so, halb so etc sagen - Beispiel: Geburtsjahr
  • Was ist die Verhältnisskala? - etwas ist doppelt oder dreimal so sehr dann muss auch die Zahl doppelt oder dreifach sein
  • Wie bezeichnet man die Intervall- und Verhältnisskala zusammengefasst und wie die Nominal- und Ordinalskala? - Intervall- und Verhältnisskala: Kardinalskala - Nominal- und Ordinalskala: kategorial
  • Zwischen welchen Häufigkeiten unterscheidet man? absolute & relative Häufigkeit
  • Was ist die absolute und was die relative Häufigkeit? Erkläre an einer Strichliste. - absolute Häufigkeit: 50 - relative Häufigkeit: 0,50
  • Zwischen welchen Darstellungsdiagrammen unterscheidet man? Wie sieht jedes aus? - Stabdiagramm: wie Balken - Histogramm: Balken, die hoch und runter, ziemlich gemischt gehen - Tortendiagramm - Polygonzug: wie ein Berg aufgebaut, er immer flacher wird
  • Was sind Kategoriensysteme und wozu braucht man sie? - Liste erstellen welche Werte wie häufig vorkommen - braucht man als Vorschritt, um Häufigkeiten im Histogramm darzustellen
  • Zwischen welchen Skalen unterscheidet man? - diskrete Skalen - kontinuierliche Skalen
  • Was sind diskrete Skalen? - abzählbar (endlich oder unendlich) - alle Daten auf Ordinal- und Nominalskala
  • Was sind kontinuierliche Skalen? - überabzählbar unendlich - Bsp: Körpergröße oder Gewicht
  • Erkläre Rohdaten und Transformierte Werte an einem Beispiel. - Rohdaten: gefahrene km und getankte Liter - Transformierte Werte: Verbrauch Liter pro 100 km
  • Welche Diagramme benutzt man am besten für die Nominalskala? Tortendiagramme, Bar-charts
  • Welche Diagramme benutzt man am besten für die Ordinalskala? Stabdiagramm
  • Welche Diagramme benutzt man am besten für die Verhältnis- und die Intervallskala? Histogramme, Polygone
  • Was gibt die Verteilung an? gibt den prozentualen Anteil jeder Kategorie an
  • Was gibt die Verteilungsfunktion an? wie viele Fälle jeweils unter einem bestimmten Wert liegen
  • Worauf steigt die Verteilungsfunktion monoton? - auf 1 bei relativen Häufigkeiten - auf 100 bei Prozentwerten - auf N bei absoluten Häufigkeiten
  • Wobei hilft das Summenzeichen? Abkürzung für Additionen mit vielen Summanden
  • Wozu benutzt man Kennwerte? - Charakterisierung des Schwerpunkts der Daten - Chrakterisierung der Diffusion in den Daten
  • Was ist der Modus und wann ist er sinnvoll? - der häufigste Wert - sinnvoll ab Nominalskalenniveau
  • Was ist der Modus in einem Histogramm oder Polygonzug? - das Maximum der Verteilung - es gibt auch bimodale und trimodale Verteilungen (der häufigste Wert tritt in 2, 3 Kategorien auf) - sind diese Kategorien benachbart, ist es eine breitgipflige Verteilung
  • Was ist der Median und wann ist er sinnvoll? - der Wert, über dem 50% der Fälle und unter dem 50% der Fälle liegen - sinnvoll ab Ordinalskalenniveau
  • Wozu ist das arithmetische Mittel da und welche Eigenschaften hat es? - Summe der Werte dividiert durch Anzahl der Werte - Nulleigenschaft - Minimumseigenschaft - Ersatzeigenschaft des arithmetischen Mittels
  • Ab wann ist die Berechnung des arithmetischen Mittels sinnvoll? ab Intervallskalenniveau
  • Was ist ein Spezialfall des arithmetischen Mittels? - das Gewogene Arithmetische Mittel (GAM)
  • Was ist das geometrische Mittel und ab wann ist es sinnvoll? -- n-te Wurzel aus dem Produkt aller Werte -um den Mittelwert aus prozentualen Zuwächsen zu errechnen - - sinnvoll ab Verhältnisskalenniveau
  • Gebe die allgemeine Formel für Zuwachsfaktoren und am Beispiel um 2% zunehmen. - wenn etwas um i*100% zunimmt, dann ist der Zuwachsfaktor 1+i - wenn etwas um 2% (2/100) zunimmt, ist der Zuwachsfaktor 1,02
  • Was ist der Rang und ab wann ist er sinnvoll? - Angabe des größten und kleinsten Wertes -> Charakterisierung hinsichtlich der Diffusion - man gibt dabei die Variationsbreite = den Rang einer Verteilung an - sinnvoll ab Ordinalskalenniveau
  • Was ist der Interdezilbereich, der Interquartilbereich und der mittlere Quartilabstand? Ab wann sind diese Dinge sinnvoll? - Streubereich der mittleren 80% einer Verteilung = Bereich zwischen P10 und P90 - Bereich zwischen P25 und P75 - (Q3-Q1)/2 - ab Ordinalskalenniveau
  • Wann ist die Berechnung der Varianz und der Standardabweichung sinnvoll? ab Intervallskalenniveau
  • Wie errechnet man den Standardfehler? Standardabweichung nochmals durch Wurzel aus n divideren
  • Warum sind die Varianz und die Standardabweichung wichtig in der Statistik? weil die Normalverteilung durch den Mittelwert und die Standardabweichung vollständig bestimmt ist
  • Was hat die Standardnormalverteilung für einen Mittelwert und eine Streuung? - Mittelwert: 0 - Streuung: 1
  • Zwischen welchen Verteilungen unterscheidet man? - symmetrisch: artihmetisches Mittel, Median, Modus sind gleich - linkssteil/rechtsschief: Modus kleiner als Median, Median kleiner als arithmetisches Mittel - rechtssteil/linksschief: Modus größer als Median, Median größer als arithmetisches Mittel
  • Was ist der Exzess und was ist der Fall wenn der Exzess kleiner oder größer 0 ist? - charakterisiert die Verteilung bzgl der Nähe der Wendepunkte zum Maximum der Verteilung - Exzess > 0: eine Verteilung, die im Vergleich zur Normalverteilung mehr Masse im Bereich um den Mittelwert hat - Exzess < 0: die Verteilung hat im Vergleich zur Normalverteilung nach außen hin mehr Masse
  • Wie kann man Datensätze graphisch darstellen? - Box-Plot - Fehlerbalkendiagramm - bivariates Streuungsdiagramm
  • Was zeigt der Box-Plot und ab wann ist er sinnvoll? - Median und Interquartilabstand - ab Ordinalskalenniveau
  • Was ist ein Fehlerbalkendiagramm und ab wann ist es sinnvoll? -  bei denenn der Mittelwert als Punkt und der Standardfehler als Balken angegeben ist - ab Intervallskalenniveau
  • Wozu benutzt man bivariate Streuungsdiagramme? - Wenn eine mindestens intervallskalierte x-Variable und eine mindestens intervallskalierte y-Variable zusammen dargestellt werden sollen
  • Was ist die Korrelation und welchen Wert kann der Korrelationskoeffizient annehmen? - Erfassen der Stärke eines linearen Zusammenhangs zwischen 2 Variablen - Korrelationskoeffizient zwischen -1 und +1
  • Was besteht für ein Zusammenhang wenn die Korrelation +1, -1 oder 0 ist? +1: vollkommen linearer Zusammenhang zwischen einer Variablen x und einer Variablen y, Gerade hat positive Steigung - -1: vollkommen linearer Zusammenhang zwischen einer Variablen x und einer Variablen y, Gerade hat negative Steigung - 0: kein linearer Zusammenhang zwischen einer Variablen x und einer Variablen y
  • Was passiert, je näher der Korrelationskoeffizient bei +1 oder -1 liegt? umso näher schmiegt sich die Punktwolke an die Gerade
  • Was passiert, je näher der Korrelationskoeffizient bei 0 liegt? umso weiter streut die Punktwolke von der Geraden weg