Statistik (Subject) / Statistik (Lesson)
There are 32 cards in this lesson
Statistik
This lesson was created by DominikR.
This lesson is not released for learning.
- Statistik Definition ist die Lehre von Methoden zum systhematischen Umgang mit Beobachtungen
- Deskriptive Statistik Methoden um Beobachtungen zu beschreiben Informationsverdichtung Beschreibung von Verteilungen Beschreibung von Zusammenhängen Beschreibung von Veränderungen
- Induktive Statistik Methoden um Rückschlüsse zu ziehen Wahrscheinlichkeitsrechnung --> Zufallsexperimente --> Eigenschaften von Zufallsvariablen Stichprobentheorie Parameter schätzen Hypothesen testen
- Arbeitsschritte statistischer Untersuchungen Planung Fragestellungen konkret formulieren Notwendige Analysen bestimmen Datenbedarfe ermittlen Arbeitsplanung Datengewinnung Datenverfügbarkeit prüfen Datenerhebung d.h. Beobachtung, Befragung oder Messung durchführen Datenspeicherung & Datenschutz Datenaufbereitung Daten prüfen Teildatensätze zusammenführen Daten ggf. umkodieren, ergänzen, bereinigen Dokumentation des Datensatzes Statistische Analyse Datensatz beschreiben Analysen bzgl. der Fragestellung durchführen Verlässlichkeit der Analysen prüfen Interpretation & Dokumentation Analyseergebnisse interpretieren Arbeitsprozess und Resultate dokumentieren
- Statistische Einheit Objekt, dass wir beobachten, befragen oder vermessen wollen
- Grundgesamtheit Menge aller interessierenden statistischen Einheiten Bsp: alle heute in Deutschland lebenden Erwerbspersonen
- Identifikationskriterien Kriterien zeitlicher, räumlicher und sachlicher Art
- Vollerhebung Alle Einheiten der Grundgesamtheit werden erhoben --> Zeitaufwendig und teuer, aber genaueste Deutung
- Teilerhebung Teilmenge der Grundgesamtheit --> schnell Ergebnisse
- Stichprobe Zufallsauswahl aus einer Grundgesamtheit Reine Zufallsstichprobe: jede statistische Einheit hat die gleiche Chance, in die Stichprobe zu kommen --> Ziel: repräsentative Informationen erhalten
- Statistisches Merkmal beobachtete Eigenschaft der statistischen Einheit Merkmalsträger --> Merkmal --> Merkmalsausprägung
- Merkmalstypen 1. qualitativ (z.B. Geschlecht) 2. quantitativ diskret (z.B. Geburtsjahr) stetig (z.B. Gewicht) quasi-stetig (z.B.Einkommen)
- Rolle des Merkmals Identifikationsmerkmal (z.B. Arbeitsmarktstatus) Hilfsmerkmal (z.B. Steuer-ID) Untersuchungsmerkmal (z.B. Einkommen)
- Statistische Variable ordnet jeder Merkamalsausprägung eine reele Zahl zu (Kodierung)
- Messbarkeitsniveaus nominal (z.B. Geschlecht (z.B.entweder oder)) ordinal (z.B. Schulbildung (z.B. mehr oder weniger)) kardinal/metrisch intervallskaliert (z.B. Geburstjahr (z.B. Abstand sinnvoll interpretierbar)) verhältnisskaliert (z.B. Einkommen (z.B. 5 mal so groß))
- Absolute Häufigkeit ni Beobachtungen ergeben eine Summe ∑
-
- Relative Häufigkeit hi gibt an wie viel Prozent der Anteil von der Summe ist. Es muss stets der Wert 1 herauskommen
- Kumulierte Häufigkeit Hi Wert, der diesen oder einen geringeren Wert angebibt Relative Häufigkeiten aufsummieren. Muss am Ende 1 ergeben
- Häufigkeitsfunktion lässt sich nur für kardinal skalierte Variablen darstellen wie oft werden die einzelnen Ausprägungen beobachtet
- Verteilungsfunktion lässt sich nur für kardinal skalierte Variablen darstellen zeigt die Kumulierte Häufigkeit an
- Größenklassen Unterteilung des gesamten Raums der möglichen Ausprägung in Unterteilungen. Diese können frei gewählt werden. Es gibt Klassen Unter- und Obergrenzen Zähle eine Beobachtung einer Klasse zu wenn sie echt größer ist als die Untergrenze und gleich oder kleiner als die Obergrenze
- Häufigkeitsdichte Relative Häufigkeit / Klassenbreite z.B. 0.16 / 500
- Diagrammarten Kreisdiagrammeinzelne Ausprägungen können sich unterscheiden lassen, sich aber nicht in eine natürliche Reihenfolge bringen. Für wenige Ausprägungen sinnvoll. Es können nur relative Häufigkeiten angeigt werden BalkendiagrammNur für ordinal skalierte Variablen möglich. Mehrere Ausprägungen möglich StabdiagrammX Achse als Zahlenstrahl. Lücken zwischen Ausprägungen möglich. Linien deuten an, dass exakt dieser Wert angezeigt wird. HistogrammDarstellung der relativen Häufigkeit, bzw. der Häufigkeitsdichte = Fläche des Balkens ist gleich der relH der Klasse
- Approximierender Polygonzug Erweiterung der Verteilungsfunktion. Prämisse: Verteilung innerhalb der Klassen sind gleich
- Maßzahl drückt einen bestimmten Aspekt der Verteilung in einer Zahl aus Typische Anwendungen von Maßzahlen sind komprimierte Darstellung von Verteilung vergleich verschiedener Datensätze Vergleich einzelner Beobachtungen zum gesamten Datensatz
- Lagemaß beschreibt die zentrale Tendenz einer Verteilung Modus Median Arithmetisches Mittel
- Streuungsmaß beschreibt die Streubreite bzw. Heterogenität einer Verteilung Spannweite Varianz und Standardabweichung Variationskoeffizient
- Konzentrationsmaß misst dich Ungleichheit in der Verteilung der Merkmalssumme Lorenzkurve Gini-Koeffizient Herfindahl-Index
- Gestaltsmaß Beschreibt die äußere Form einer Verteilung Schiefe bzw. Symmetrie Wölbung (bzw. Kurtosis)
- Modus xMod = die am häufigsten vorkommende Ausprägung/ höchste relative Häufigkeit Der Modus ist für alle Messbarkeitsniveaus anwendbar Es ist möglich, dass der Modus einer Reihe nicht eindeutig ist, weil mehrere Ausprägungen am häufigsten sind
- Median xMed = teilt die sortierte Beobachtungsreihe in zwei (gleich große) Hälften Variable muss mindestens ordinal skaliert sein n ungerade: xMed = xn+1/2 n gerade: xMed = 1/2*(xn/2+xn/2+1)
- Quantile q-Quantil bzw. x[q] = teilt die sortierte Beobachtungsreihe in einen Anteil q kleinere Ausprägungen und einen Anteil (1-q) größeren Werten: relH ( X ≤ x[q] ) ≥ q und relH ( X ≥ x[q] ) ≥ (1-q)
-
