Statistik (Subject) / Statistik (Lesson)

There are 32 cards in this lesson

Statistik

This lesson was created by DominikR.

Learn lesson

This lesson is not released for learning.

  • Statistik Definition ist die Lehre von Methoden zum systhematischen Umgang mit Beobachtungen
  • Deskriptive Statistik Methoden um Beobachtungen zu beschreiben Informationsverdichtung Beschreibung von Verteilungen Beschreibung von Zusammenhängen Beschreibung von Veränderungen
  • Induktive Statistik Methoden um Rückschlüsse zu ziehen Wahrscheinlichkeitsrechnung --> Zufallsexperimente --> Eigenschaften von Zufallsvariablen Stichprobentheorie Parameter schätzen Hypothesen testen
  • Arbeitsschritte statistischer Untersuchungen Planung   Fragestellungen konkret formulieren   Notwendige Analysen bestimmen   Datenbedarfe ermittlen   Arbeitsplanung Datengewinnung   Datenverfügbarkeit prüfen   Datenerhebung d.h. Beobachtung, Befragung oder Messung durchführen   Datenspeicherung & Datenschutz Datenaufbereitung   Daten prüfen   Teildatensätze zusammenführen   Daten ggf. umkodieren, ergänzen, bereinigen   Dokumentation des Datensatzes Statistische Analyse   Datensatz beschreiben   Analysen bzgl. der Fragestellung durchführen   Verlässlichkeit der Analysen prüfen Interpretation & Dokumentation   Analyseergebnisse interpretieren   Arbeitsprozess und Resultate dokumentieren
  • Statistische Einheit Objekt, dass wir beobachten, befragen oder vermessen wollen
  • Grundgesamtheit Menge aller interessierenden statistischen Einheiten Bsp: alle heute in Deutschland lebenden Erwerbspersonen
  • Identifikationskriterien Kriterien zeitlicher, räumlicher und sachlicher Art
  • Vollerhebung Alle Einheiten der Grundgesamtheit werden erhoben --> Zeitaufwendig und teuer, aber genaueste Deutung
  • Teilerhebung Teilmenge der Grundgesamtheit --> schnell Ergebnisse
  • Stichprobe Zufallsauswahl aus einer Grundgesamtheit Reine Zufallsstichprobe: jede statistische Einheit hat die gleiche Chance, in die Stichprobe zu kommen --> Ziel: repräsentative Informationen erhalten
  • Statistisches Merkmal beobachtete Eigenschaft der statistischen Einheit Merkmalsträger --> Merkmal --> Merkmalsausprägung
  • Merkmalstypen 1. qualitativ (z.B. Geschlecht) 2. quantitativ diskret (z.B. Geburtsjahr) stetig (z.B. Gewicht) quasi-stetig (z.B.Einkommen)
  • Rolle des Merkmals Identifikationsmerkmal (z.B. Arbeitsmarktstatus) Hilfsmerkmal (z.B. Steuer-ID) Untersuchungsmerkmal (z.B. Einkommen)
  • Statistische Variable ordnet jeder Merkamalsausprägung eine reele Zahl zu (Kodierung)
  • Messbarkeitsniveaus nominal (z.B. Geschlecht (z.B.entweder oder)) ordinal (z.B. Schulbildung (z.B. mehr oder weniger)) kardinal/metrisch   intervallskaliert (z.B. Geburstjahr (z.B. Abstand sinnvoll interpretierbar))   verhältnisskaliert (z.B. Einkommen (z.B. 5 mal so groß))
  • Absolute Häufigkeit ni  Beobachtungen ergeben eine Summe ∑
  • Relative Häufigkeit hi gibt an wie viel Prozent der Anteil von der Summe ist. Es muss stets der Wert 1 herauskommen
  • Kumulierte Häufigkeit Hi  Wert, der diesen oder einen geringeren Wert angebibt Relative Häufigkeiten aufsummieren. Muss am Ende 1 ergeben
  • Häufigkeitsfunktion lässt sich nur für kardinal skalierte Variablen darstellen wie oft werden die einzelnen Ausprägungen beobachtet
  • Verteilungsfunktion lässt sich nur für kardinal skalierte Variablen darstellen zeigt die Kumulierte Häufigkeit an
  • Größenklassen Unterteilung des gesamten Raums der möglichen Ausprägung in Unterteilungen. Diese können frei gewählt werden. Es gibt Klassen Unter- und Obergrenzen Zähle eine Beobachtung einer Klasse zu wenn sie echt größer ist als die Untergrenze und gleich oder kleiner als die Obergrenze
  • Häufigkeitsdichte Relative Häufigkeit / Klassenbreite z.B. 0.16 / 500
  • Diagrammarten Kreisdiagrammeinzelne Ausprägungen können sich unterscheiden lassen, sich aber nicht in eine natürliche Reihenfolge bringen. Für wenige Ausprägungen sinnvoll. Es können nur relative Häufigkeiten angeigt werden BalkendiagrammNur für ordinal skalierte Variablen möglich. Mehrere Ausprägungen möglich StabdiagrammX Achse als Zahlenstrahl. Lücken zwischen Ausprägungen möglich. Linien deuten an, dass exakt dieser Wert angezeigt wird.  HistogrammDarstellung der relativen Häufigkeit, bzw. der Häufigkeitsdichte = Fläche des Balkens ist gleich der relH der Klasse
  • Approximierender Polygonzug Erweiterung der Verteilungsfunktion. Prämisse: Verteilung innerhalb der Klassen sind gleich
  • Maßzahl drückt einen bestimmten Aspekt der Verteilung in einer Zahl aus Typische Anwendungen von Maßzahlen sind komprimierte Darstellung von Verteilung vergleich verschiedener Datensätze Vergleich einzelner Beobachtungen zum gesamten Datensatz
  • Lagemaß beschreibt die zentrale Tendenz einer Verteilung Modus Median Arithmetisches Mittel
  • Streuungsmaß beschreibt die Streubreite bzw. Heterogenität einer Verteilung Spannweite Varianz und Standardabweichung Variationskoeffizient
  • Konzentrationsmaß misst dich Ungleichheit in der Verteilung der Merkmalssumme Lorenzkurve Gini-Koeffizient Herfindahl-Index
  • Gestaltsmaß Beschreibt die äußere Form einer Verteilung Schiefe bzw. Symmetrie Wölbung (bzw. Kurtosis)
  • Modus xMod = die am häufigsten vorkommende Ausprägung/ höchste relative Häufigkeit Der Modus ist für alle Messbarkeitsniveaus anwendbar Es ist möglich, dass der Modus einer Reihe nicht eindeutig ist, weil mehrere Ausprägungen am häufigsten sind
  • Median xMed = teilt die sortierte Beobachtungsreihe in zwei (gleich große) Hälften Variable muss mindestens ordinal skaliert sein n ungerade:   xMed = xn+1/2 n gerade:       xMed = 1/2*(xn/2+xn/2+1) 
  • Quantile q-Quantil bzw. x[q] = teilt die sortierte Beobachtungsreihe in einen Anteil q kleinere Ausprägungen und einen Anteil (1-q) größeren Werten: relH ( X ≤ x[q] ) ≥ q und relH ( X ≥ x[q] ) ≥ (1-q)