Statistik (Fach) / WS 16 (Lektion)

In dieser Lektion befinden sich 50 Karteikarten

Seeber

Diese Lektion wurde von Abison_Cruso erstellt.

Lektion lernen

  • Was ist Statistik? - Statistik  deutet und ordnet die Massen an Daten >> analysiert sie [lernen aus Daten] - Kunstfertigkeit auf Fragen Antworten zu finden, die Methoden sind die Werkzeuge - Die Kunst von Daten zu lernen! ...
  • Substanzwissenschaft>> Statistik ? 1. Formulierung einer Fragestellung >>> Bereitstellung geeigneter mathematischer und statistischer Modelle 2. Durchführung einer Studie >> Datensammlung 3. Verarbeitung, Auswertung und Präsentation ...
  • Deskriptive Statistik? Beschreibend quantitative Daten zu Tabellen graphische Darstellungen und Kennzahlen >> Aussagen nur über die vorliegenden Daten/Stichprobe
  • Induktive Statistik ? Schlussfolgerungen unter Verwendung von stochastischen Modellen Aussagen über Grundgesamtheit
  • Explorative Statistik? Suchende Statistik >>Aufspüren von Strukturen mit deskriptiven Methoden,  Aussagen über vorliegende Daten, vorsichtige, spekulative Aussagen! Fragen zur Grundgesamtheit.
  • Statistische Einheiten ? Grundgesamtheit/Population? ... 1. Subjekte oder Objekte für die man sich in einer Studie interessiert 2. Die Gesamtheit der Statistischen Einheiten für die man sich während einer Studie interessiert; >> kann endlich, unendlich oder ...
  • Parameter? Statistiken? 1. Maßzahlen, numerisch, in Zahlen ausgedrückte Charakteristika der Grundgesamtheit  2. Aus den Stichproben errechnete Größen
  • Zufallsstichproben ? 1. zufällig ausgewählt 2. über jede Einheit der Grundgesamtheit ist die wahrscheinlichkeit bekannt mit der die Einheit von der Zufallsstichprobe ausgewählt wird >> vermeiden von Subjektiven Verzerrungen ...
  • Merkmalstypen? Stetiges Merkmal: Überabzählbare Anzahl an Werten annehmbar (z.b Körpergröße eines Menschen oder die Temperatur eines Sees, man könnte immer noch genauer und noch genauer Messen es gibt immer noch ...
  • Skalen? Nominalskala: Die Ausprägung stellt Namen oder Kategorien dar, die sich gegenseitig ausschließen und keine Ordnung aufweisen! [nominalskaliertes Merkmal] Beispiel: Welche Partei gewählt werden soll? ...
  • Interpretierbarkeit, sinnvolle Berechnung von Skalen? ... xxxxxxxxxx           Nominal / Ordinal / Intervall / Ratio(verhältniss) auszählen            Ja          / Ja         / Ja          / Ja ordnen                 Nein ...
  • Kardinalskala ? Intervall- und Ratio- bzw. Verhältnissskala werden oft zu Kardinalskala zusammengefasst  >> ein kardinalskalierstes Merkmal wird als Metrisch bezeichnet!
  • qualitative oder kategoriale Merkmale ? quantitative ... 1.Größen die endlich viele Ausprägungen besitzen und maximal ordinalskaliert sind. 2. Die Ausprägungen geben eine Intensität oder Ausmaß wieder; Messungen im herkömmlichen Sinne die Zahlen darstellen ...
  • Datenmatrix? rechteckige Tabelle, die die an Untersuchungseinheiten beobachteten Merkmalausprägungen enthält. Zeilen entsprechen den Untersuchungseinheiten Spalten entsprechen den Merkmalen/Variablen
  • Häufigkeitsverteilung: absolut, relativ? Absolut: tatsächliche Anzahl, Häufigkeit an Merkmalausprägungen, an Untersuchungsanheiten einer Merkmalausprägung relativ: absolute Häufigkeit dividiert durch die Anzahl an Untersuchungseinheiten
  • Graphische Darstellungen, Schaubilder, Graphiken etc.: ... Die Entschlüsselung graphischerInformation ist, mehr als die Entschlüsselung numerischer Information, von subjektiver Interpretation beeinflusst. >> Die Informationsaufnahme durch Graphiken erfolgt ...
  • 3 wichtige Punkte beim Design graphischer Darstellungen? ... 1. Maximiere - in Maßen - das Datentinte-Verhältniss 2. Lösche - in Maßen - Tinte ohne statistischen Inhalt 3. Lösche - in Maßen - redundante Datentinte [ Tufte 2001 ]
  • Gute Darstellungen von Häufigkeitsverteilungen ? > Nicht Kreisdiagramme, besser Säulen- und Balkendiagramme !
  • Beschreibung von Histogrammen? Unimodal und symetrisch: eingipfelig ohne weitere maxima annähernd symetrisch von der Mitte nach außen hin abnehmend (Glockenkurve) Bimodal: zweigipfelig, es gibt auch mulitmodal. Unimodal unsymetrisch: ...
  • Beschreibung von Histogrammen? Unimodal und symetrisch: eingipfelig ohne weitere maxima annähernd symetrisch von der Mitte nach außen hin abnehmend (Glockenkurve) Bimodal: zweigipfelig, es gibt auch mulitmodal. Unimodal unsymetrisch: ...
  • arithmetrisches Mittel? Median oder Zentralwert? 1. Summe der erhobenen Merkmalausprägungen dividiert durch die Anzahl der Beobachtungen >> Bsp: Zahlenwerte: 14,51,90,1100,1400 >>> Summe dividiert durch Anzahl 2. Median: Bsp: 14,51,90,1100,1400 >>> ...
  • arithmetrisches Mittel? Median oder Zentralwert? 1. Summe der erhobenen Merkmalausprägungen dividiert durch die Anzahl der Beobachtungen >> Bsp: Zahlenwerte: 14,51,90,1100,1400 >>> Summe dividiert durch Anzahl                           ...
  • Fünf-Punkte Charakterisierung von Häufigkeitsverteilungen? ... 1. Mininmum min(y) 2. unteres quartil y0,25 3. Median y0,5 4. oberes Quartil y0,75 5. Maximum max(y)
  • Varianz? Standardabweichung? Varianz ist ein Streuungsmaß: Ermittelt aus der Summe, der jeweiligen quadranten der Abweichungen jeder Ausprägung eines Merkmals zum Arithmetrischen Mittel: [s² oder Sigma²] Beispiel: Betrachtet ...
  • Normalverteilung, Standardabweichung ? Normalverteilt wenn gilt: arithmetrisches Mittel +- s = 68% ; arith.Mittel +- 2s = 95%
  • Statistische Ausreißer? In der Regel Werte die um mehr als das 1,5 fache vom unteren Quartil nach unten und vom oberen Quartil nach oben abweichen.
  • Konzentration? Absolute, Relative? Die Messung der Konzentration ist nur sinnvoll wenn alle Merkmalswerte nicht negativ sind! Man spricht von Konzentration wenn sich eine Ungleichverteilung aufzeigt.  Die Absolute Konzentration bezieht ...
  • Lornezkurve? Gini-Koeffizient? 1. Bietet einen Weg die Konzentration Graphisch darzustellen. Die Anteile der Merkmalsträger an der Grundgesamtheit werden dabei und ihre Anteile an Merkmalssummen werden dabei in Beziehung gesetzt. ...
  • Bivariate Statistik? Zwei Variablen und n Zeilen >> für jede Untersuchungseinheit i liegt also ein Merkmalausprägungs Paar (xi,yi) vor!
  • 3 Arten von Variablen? 1. Zielvariablen, abhängige Variablen >> werden von anderen Größen beeinflusst. 2. unabhängige Variablen, Einflussgrößen >> üben auf andere Variablen einfluss. 3. Qualitativ unabhängige Variablen ...
  • Gerichtete vs ungerichtete Zusammenhangsstrukturen ... 1. Unterscheindung von Einflussgröße und Zielvariable 2. keine Unterscheindung
  • Gerichtete Zusammenhangsstruktur > Koordinatensystem, ... 1. Abhängige (Zielvariable) Variabel auf der Y-Achse 2. Einflussgröße Variabel auf der X-Achse
  • Gerichtete Zusammenhangsstruktur > Koordinatensystem, ... 1. Abhängige (Zielvariable) Variabel auf der Y-Achse (Ordinate) 2. Einflussgröße Variabel auf der X-Achse (Abszisse)
  • Muster bei Streudiagrammen ? Ist ein eindeutiges Muster in einem Streudiagramm zu erkennen spricht man von einem Zusammenhang, Merkmalausprägungen die klar ausserhalb dieses Musters liegen werden statistische Außreiser genannt.
  • Kovarianz? Maß für den linearen Zusammenhang zweier Variablen: + Vorzeichen >> Steigt ein Wert xi steigt der Wert yi auch - Vorzeichen >> Steigt ein Wert xi nimmt der Wert yi ab >> Ein Wert von Null oder nahe ...
  • Korrelationskoeffizient nach Bravais-Pearson Die Kovarianz dividiert durch die Summe der Standardabweichungen von X und Y (der beiden Variablen) ist eine Zahl zwischen -1 und 1 >> deren Absolutbetrag die Stärke des linearen Zusammenhangs bestimmt ...
  • Korrelationskoeffizient nach Bravais-Pearson Die Kovarianz dividiert durch die Summe der Standardabweichungen von X und Y (der beiden Variablen) ist eine Zahl zwischen -1 und 1 >> deren Absolutbetrag die Stärke des linearen Zusammenhangs bestimmt ...
  • Odds Ratio Formelt?Relative Chance oder Kreuzproduktverhältnis! ... XXXX          erinnert  ///  nicht erinnert   ///// Summe Spot A         50        /// 74                       ///// 124 Spot B         93       ///  101         ...
  • Chi² Formel? (hi(Häufigkeit)-He(Erwartungshäufigkeit))²/ He >>> normierte quadrierte Abweichung E(Summe n) normierter quadrierter Abweichungen >>> Chi² Nullhypothese wird verworfen (keine Gleichverteilung) wenn ...
  • Chi² Formel? (hi(Häufigkeit)-He(Erwartungshäufigkeit))²/ He >>> normierte quadrierte Abweichung E(Summe n) normierter quadrierter Abweichungen >>> Chi² Nullhypothese wird verworfen (keine Gleichverteilung) wenn ...
  • Kontingenzkoeffizient Formel? Wurzel aus Chi²/(Chi²+n) >> diesen normiert (ist er fast) seine Wertebereich liegt bisher von 0 bis (auf jeden Fall) unter 1 >>> jedoch kleinerer Wert geringer Zusammenhang , größerer Wert, großer ...
  • Stichprobenerhebungs Methoden? Einfache Zufallsstichprobe  - Jede Untersuchungseinheit gleiche Wahrscheinlichkeit ausgewählt zu werden Geschichtete Zufallsstichprobe - Verschiedene Schichten (nicht überlappende), werden jeweils ...
  • Repräsentative Stichprobe `? Eine Stichprobe gilt als repräsentativ wenn sie Rückschlüsse auf die Grundgesamtheit zulässt! Kein mathematisch präzise definierter Begriff
  • Bernoulliverteilung? Beschreibung von zufälligen Ereignissen bei denen nur zwei mögliche Versuchsausgänge interessieren, z.B 0 oder 1 ! Bsp.: Werfen einer Münze (Wappen p = 1 / 2, Zahl q = 1 / 2)Werfen eines Würfels, ...
  • Binomialverteilung? Binomialverteilung beschreibt den wahrscheinlichen Ausgang einer Folge von gleichartigen Prozessen, bei denen es nur zwei Ausgangsmöglichkeiten gibt. Also die Ergebnisse von Bernoulli-Prozessen. Wenn ...
  • Normalverteilung? Gaußkurve, Glockenkurve etc.? Normalverteilung beruht auf dem zentralen Grenzwertsatz, der besagt das wenn beliebig viele unabhängige, identisch verteilte Variablen normal verteilt sind. Also oftmals komplexe nicht bekannte Verteilungen ...
  • Stetige und Diskrete Verteilungen ? Stetige: Chi-Quadrat-(nicht-negativ, 1Parameter (Freiheitsgrad); Fisher-(allen reellen Zahlen, 2Parameter(Freiheitsgrade); Student-(allen reellen Zahlen, 1Parameter(Freiheitsgrad) Diskrete: bernoulli, ...
  • Dichtefunktion? Integral f(x)dx=1 ! [Verteilungsfunktion]
  • Standardfehler des Mittelwertes? Ist die Standardabweichung der Schätzung des Mittelwertes der Grundgesamtheit, durch den Mittelwert der Stichprobe.
  • Was ist der Fehler 1.Art, was der Fehler 2.Art ? 1. Art ist, wenn die Aktion ist Ho abzulehnen, Ho jedoch korrekt ist 2. Art ist, wenn die Aktion ist Ho anzunehmen, Ho jedoch falsch ist