Statistik (Fach) / Beschreiben / Analysieren / Darstellen (Lektion)
In dieser Lektion befinden sich 59 Karteikarten
Grundlagen
Diese Lektion wurde von tihomir erstellt.
- Wo treffen wir auf Statisitk? Business (Effekt von Marketingausgaben, Performancemessungen usw.) Volkswirschaft (BIP, Arbeitslosenquote, Messung der Kaufkraft usw.) Finanzmärkten (Historische Rendite, Risikomessung, Marktprognosen usw.) Politik (Wahlprognosen, Umfragen, Demografie, Staatsfinanzen usw.) Zeitung (Wetterdaten, Sportdaten, Lebensqualität usw.) Konsum (Benzinverbrauch, Energieeffizienz, Bewertung von Gütern usw.) Forschung (Zusammenhang Rauchen und Gesundheit, Ausbildung und Lohn usw.)
- Weshalb brauchen wir Statistik? Um Antworten auf interessante Fragen zu geben. Um Statistiken lesen / kritisch hinterfragen / selbst erstellen zu können. Weil Statistik im Business Bereich wichtiger wird. Um Forschung zu betreiben -> quantitative Methode. Um Informationsprobleme zu vereinfachen. Weil die verfügbare Datenbasis immer breiter wird. Weil die Rechenpower immer grösser wird.
- Was beinhaltet die Statistik? Sammeln von Daten Klassifizieren von Daten Zusammenfassen von Daten Analyse von Daten Interpretieren von Daten
- Wofür steht die Abkürzung " i " Beobachtung / Erhebungseinheit = ein Objekt zu welchem wir Daten messen/sammeln können.
- Wofür steht die Abkürzung " N " Bevölkerung / Population / Grundgesamtheit = der Datensatz aller Objekte über welche wir eine Aussage treffen wollen.
- Wofür steht die Abkürzung " n " Stichprobe = Teilmenge der Bevölkerung
- Wofür steht die Abkürzung " x " Variable / Merkmal = eine Charakteristik einer einzelnen Beobachtung
- Was versteht man unter Merkmalsausprägung? mögliche Werte für Merkmale
- Was versteht man unter Wertebereich? Bereich aller möglichen Werte für Merkmalsausprägungen
- Was bedeutet Inferenz? Rückschliessen von einer Stichprobe auf die Bevölkerung
- Welche zwei Gebiete gibt es in der Statistik? Deskriptive Statistik Schliessende Statistik
- Verwendung einer Stichprobe in der deskriptiven Statistik? um mit Hilfe numerischer und grafischer Methoden die Struktur und Eigenheiten dieser Stichprobe darzustellen, Information zusammenzufassen und in nützlicher Form zu präsentieren.
- Verwendung einer Stichprobe in der schliessenden Statistik? um mit Hilfe numerischer Methoden Schätzungen, Entscheidungen, Vorhersagen und andere Aussagen über eine Bevölkerung zu treffen.
- Was bedeutet Reliabilität? Gibt Auskunft über den Grad der Zuverlässigkeit einer Inferenz.
- Wie ist das Vorgehen bei der deskriptiven Statistik? Identifikation Bevölkerung / Stichprobe Selektion einer oder mehrerer interessierender Variablen Erstellung von Tabellen, Grafiken, numerische Zusammenfassungen der Daten Identifikation von Zusammenhängen / Eigenheiten der Daten
- Wie ist das Vorgehen bei der schliessenden Statistik? Identifikation Bevölkerung Selektion einer oder mehrerer interessierender Variablen Stichprobe der Bevölkerung ziehen Inferenz von Stichprobe auf Bevölkerung Mass der Reliabilität der Inferenz
-
- Welche Typen von Daten gibt es? Quantitative Daten (sind metrisch messbare Grössen welche auf numerischer Skala aufgezeichnet werden können) Qualitative Daten (sind nominale Merkmale, welche nicht auf numerischer Skala aufgezeichnet, jedoch klassifiziert/kategorisiert werden können)
- Wie können quantitative und qualitative Daten unterteilt werden? Quantitative: Diskret (0, 1, 2, 3,...), Kontinuierlich/Stetig (3.12, 4.589,...) Qualitative: Binär (ja/nein), Multinominal (blau, rot, grün,...), Ordinal (hoch, mittel, tief)
- Von wo kriegen wir Daten? von Befragungen von publizierten Quellen von konstruierten Experimenten von Beobachtungen
- Welche möglichkeiten gibt es bei der Datenerhebung mittels Befragung? Persönliches Interview (CAPI: Computer Assisted Personal Interview) Telefonisches Interview (CATI: Computer Assisted Telephone Interview, ACTI: Automated Computer Telephone Interview) Schriftlicher Fragebogen Fragebogen via Internet (CAWI: Computer Assisted Web Interview)
- welch Vorteile / Nachteile hat das persönliche Interview (CAPI) Vorteile: Standardisierung frei, vollkommen flexible Fragenkonstruktion, komplexe [explorative] Erhebungen, Verwendung von Hilfsmittel möglich, tiefe Dropout-Rate Nachteile: Teuer, Gefahr Beeinflussung durch Interviewer, mangelnde Anonymität, Privatsphäre
- welche Vorteile / Nachteile hat das telefonische Interview (CATI, ACTI)? Vorteile: günstig, höhere Anonymität bei Befragung, schnelle Erhebung breiter Bevölkerungsgruppe Nachteile: Gefahr Beeinflussung durch Interviewer, höhere Selbstselektion, nur einfache Fragen
- welche Vorteile / Nachteile hat die schriftliche Befragung mittels Fragebogen? Vorteile: günstig, (Schein-)Anonymität, keine Beeinflussung durch Interviewer, komplexe Fragen möglich (bspw. mit viel Text/Bildern), schnelle Erhebung Nachteile: Standardisierung nötig, hohe Selbstselektion, Mehrfachteilnahme möglich
- welche Vorteile / Nachteile hat der Fragebogen via Internet (CAWI)? Vorteile: sehr günstig, (Schein-)Anonymität, keine Beeinflussung durch Interviewer, komplexe Fragen möglich (bspw. mit Videoanimationen), schnellste Erhebung Nachteile: Standardisierung, sehr hohe Selbstselektion (generell tiefste Rücklaufquote), sensitiv bezüglich Distributionskanal, Mehrfachteilnahme
- welche Quellen von publizierten Daten gibt es? Öffentliche Statistiken (Bundesamt für Statistik) Öffentliche Marktdaten (SIX Group) Fachzeitschriften (Economist) Datenbanken (Thomson Reuters) Bücher, Websites, Geschäftsberichte
- was versteht man unter einem konstruierten Experiment? Forscher laden Individuen in ein «Labor» ein und spielen eine (Markt-)Situation mit monetären Anreizen nach.
- welche Vorteile / Nachteile hat das konstruierte Experiment? Vorteile Kontrolle über Umgebung Kontrolle über Spielregeln Kontrolle über Rahmenbedingungen Geringe Stichprobe führt zu Signifikanz Kausalität Messung von Variablen, welche in Umwelt schwer zu beobachten sind Nachteile Externe Validität Repräsentativität der Subjekte Laborbedingungen Anreize sind gering
- was bedeutet Repräsentativität? eine repräsentative Stichprobe zeigt alle typischen Charakteristiken, welche in der Bevölkerung vorhanden sind. in einer zufälligen Stichprobe hat jeder aus der Bevölkerung dieselbe Wahrscheinlichkeit selektiert zu sein. Ziel: keine Selbstselektion, keine Verzerrung der Stichprobe
- wann tritt eine verzerrte Selektion (Selection Bias) auf? wenn eine Teilmenge der Bevölkerung eine geringere Wahrscheinlichkeit hat in die Stichprobe zu kommen.
- wann tritt eine Schweigeverzerrung (Nonresponse Bias) auf? wenn ein Forscher nicht fähig ist für alle Objekte einer Stichprobe eine Beobachtung zu erstellen (Bspw. Nicht-Zurücksenden eines Fragebogens).
- wann treten Messfehler (Measurement error) auf? wenn systematisch Fehler in der Aufzeichnung von Beobachtungen stattfinden (Bspw. bei ungenauen Fragestellungen oder Einfluss eines Interviewers).
- welche Darstellungsarten qualitativer / quantitativer Daten kennst du? Qualitative Daten Tabellarische Zusammenfassung Balkendiagramm (Säulendiagramm) Kuchendiagramm Paretodiagramm Quantitative Daten Stamm-Blatt-Diagramm Häufigkeitsverteilung / Histogramm
-
- was bedeutet klassifizieren? Bei der Klassifizierung wird eine Messung einer Klasse zugeordnet.
- was versteht man unter absoluter Klassenhäufigkeit? Die absolute Klassenhäufigkeit misst die Anzahl / Häufigkeit von Beobachtungen, welche zu einer Klasse zugeteilt sind.
- was versteht man unter relativer Klassenhäufigkeit? Die relative Klassenhäufigkeit misst die relative Häufigkeit von Beobachtungen einer Klasse im Verhältnis zu allen Beobachtungen.
- was versteht man unter tabellarischer Zusammenfassung? Eine tabellarische Auflistung aller Klassen sowie deren absolute und relative Klassenhäufigkeit.
- was versteht man unter Balkendiagramm / Säulendiagramm? Klassen werden als Balken dargestellt (vertikal oder horizontal), wobei die Grösse des Balken (Höhe oder Breite) die absolute oder relative Klassenhäufigkeit darstellt.
- was versteht man unter Kuchendiagramm? Klassen werden dargestellt als Stücke eines Kuchens, wobei die Grösse eines Stücks die relative Klassenhäufigkeit darstellt.
- was versteht man unter Paretodiagramm? Identisch zum Balkendiagramm, jedoch absteigend geordnet nach Grösse der Balken. Meist erweitert um Linie mit kumulativer Häufigkeit.
- was versteht man unter einem Stamm-Blatt-Diagramm beim Stamm-Blatt-Diagramm werden alle Beobachtungen in Stamm und Blätter aufgeteilt.Der häufig auftretende vorderer Teil der Zahl bildet den Stamm und der folgende teil der Zahl das Blatt.
- was ist ein Histogramm Einteilung numerischer Werte in Klassen konstanter Grösse
- wie geht man bei der Erstellung eines Histogramms vor? Bestimme Spannweite Wähle Anzahl Klassen Berechne Klassenintervalle/-grenzen (nicht zwingend gleich gross) Zähle Beobachtungen pro Klasse Erstelle grafische Darstellung
- wozu braucht es Lagemasse? Zum Beschreiben einer zentralen Tendenz einer Datenmenge.
- wozu braucht es Streuungsmasse? Zum Beschreiben der Streuung oder Dispersion einer Datenmenge.
- Definition Mittelwert? Der Mittelwert entspricht der Summe aller Werte dividiert durch die Anzahl Werte im Datenset. Abkürzung = x‾ ("x bar")
- Definition Median? Der Median (auch Zentralwert) eines Datensets ist der mittlerste Wert, wenn alle Werte aufsteigend (oder absteigend) geordnet werden.
- Wie reagieren Mittelwert und Median auf Ausreisser? Mittelwert ist sensibel auf Ausreisser Median ist robust gegenüber Ausreisser
- Wie ist die Schiefe eines Datensets anhand eines Vergleichs von Mittelwert und Median? Median > Mittelwert: «linksschief» (rechtssteil) Median = Mittelwert: «symmetrisch» Median < Mittelwert: «rechtsschief» (linkssteil)
- Definition Modus? Der Modus eines Datensets entspricht der häufigsten auftretenden Beobachtung. Der Modus eines Datensets muss nicht zwingend einzigartig sein.
- Definition Spannweite? Die Spannweite misst die Differenz zwischen der grössten und kleines Beobachtung eines Datensets und ist ein Mass für die Streuung der Daten. Vorteil: Einfach zu berechnen und interpretieren. Nachteil: Spannweite ignoriert wie Daten innerhalb der Spannweite verteilt sind.
-