MWU 15 (Fach) / Quantitative Methoden (Lektion)

In dieser Lektion befinden sich 19 Karteikarten

QM

Diese Lektion wurde von Isal123 erstellt.

Lektion lernen

  • Warum ist es wichtig über das Messniveau der Variablen Bescheid zu wissen, bevor man eine Datenanalyse durchführt? Eine Unterscheidung in metrisch, ordinal und nominal ist wichtig, da es vom Messniveau abhängt, welche grafischen und analytischen Methoden verwendet werden sollten ( kein Kreisdiagramm aus metrischen Daten)
  • Erläutern Sie die Unterschiede zwischen strukturprüfenden und strukturdeckenden Verfahren. Welche Auswirkungen hat dies auf die Modellanahmen? Strukturprüfende Verfahren: dabei werden im Vorfeld Annahmen (Hypothesen) über Zusammenhänge zwischen den Phänomenen getroffen und diese in die statistische Sprache übersetzt. Somit wird mit dem Verfahren geprüft, inwieweit sich diese Annahmen empirisch bestätigen lassen. (Bsp: Multiple lineare Regression, Kovarianzstrukturanalyse, Mehrebenenanalyse,..) Strukturdeckende Verfahren: Dabei wird enstprechend untersucht, inwieweit sich neue Strukturen/Zusammenhänge in den Daten auf statistisch-mathematischem Wege entdecken lassen. Somit werden hier keine explizit formulierten Hypothesen geprüft, was gerade bei explorativen Studien sinnvoll sein kann. (Bsp: Faktorenanalyse, Clusteranalyse)
  • Wofür werden Dummy Variablen verwendet? Vergleiche zwischen Gruppen (zB.: Länder, Branchen)  Um zB. die Zuordnung einer Person zu einer Gruppe modellieren zu können, genügen Variablen, die nur zwei Werte annehmen können (zB.: Eins(1) für wahr und Null(0) für falsch. Deshalb werden diese Variablen häufig 0-1 Variablen oder auch qualitative Variablen genannt. 
  • Erklären Sie Idee und Vorgehensweise eines statistischen Hypothesentests anhand eines Testverfahrens ihrer Wahl. Zweiseitiger Hypothesentest: Das Ziel des Hypothesentests besteht darin, aufgrund einer Stichprobe zu prüfen, ob eine vermutete Wahrscheinlichkeit, die Hypothese, als wahr angenommen werden kann oder ob sie verworfen werden muss Vorgehensweise: Man stellt die Nullhypothese auf (Ho) Dann gibt man ein Signifikanzniveau (Irrtumswahrscheinlichkeit) vor und bestimmt damit den Ablehnungsbereich Danach zieht man eine Stichprobe Zum Schluss kann man anhand der vorher aufgestellten Entscheidungsregeln die Hypothese verwerfen oder auch nicht verwerfen Einseitiger Hypothesentest: Bis hier hin wurde geprüft, ob eine Wahrscheinlichkeit signifikant nach oben oder nach unten abwich. Manchmal interessiert einen auch nur die Richtung oder man hat eine Vermutung, wohin es abweichen wird. Dann ist ein einseitiger Hypothesentest angemessen. Bsp: Frauen verdienen mehr als Männer
  • Welche Problematik tritt bei mehrfachem Testen auf und was kann man dagegen tun? (Alpha Fehler Inflation) Wenn mehrere Tests durchgeführt werden besteht die Gefahr der Fehlerhäufung. Um diese Gefahr zu vermeiden muss das Signifikanzniveau nach unten korrigiert werden, indem man es durch die Anzahl der durchgeführten Tests dividieren. (Bonferroni-Korrektur)
  • Es stehen folgende Variablen zur Verfügung...und Sie möchten...herausfinden. Welche statistische Methode würden Sie zu diesem Zweck anwenden? mehrere kategoriale Variablen -> Chi2 Test, Odds-Ratio-Test mehrere metrische Variablen -> lineare Regression, T-Test für abhängige Stichproben, Korrelation nach Pearson/Spearman Metrische und kategoriale Variabelen -> Zweistichproben T-Test, U-Test, Kruskal-Wallis-Test
  • Warum ist die Methode der Stichprobenziehung so wichtig? Welche Methoden kennen Sie? Auf Grund der Größe der Grundpopulation ist es kaum möglich, alle Mitglieder derselben zu befragen, daher zieht man im Allgemeinen eine Stichprobe, weil diese eine Teilmenge der Population darstellt.  Diese Stichprobe sollte idR so ausgewählt werden, dass sie ein unverzerrtes Abbild der Grundgesamtheit darstellen Arten der Stichproben: Zufallsauswahl: ich habe zb eine Liste aller Wirtschaftsprüfer von ganz Österreich und aus dieser ziehe ich meine Stichprobe Klumpenauswahl: setzt voraus, dass die Population sich in natürliche Gruppen teilt und alle weisen eine große Ähnlichkeit auf (zB. alle Bewohner eines Wiener Bezirks) Quotenwahl: Stichprobe wird anhand von Quoten gezogen (zB. alle Wirtschaftsstudenten Österreichs, dann wähle ich zufällig ein paar Unis und dort werden ein paar Studenten zur Forschung eingeladen) Konzentrationsauswahl: Aussagen werden aus gewissen Fällen gezogen (zB. Untersuchung über Skifahrer in Westösterreich)
  • Diskutieren Sie den Begriff "Repräsentativität", was ist ihr zuträglich, was abträglich? Unter Repräsentativität versteht man, dass man aus der Grundgesamtheit eine Stichprobe zieht, die ein möglichst unverzerrtes Abbild darstellt. Die Grundgesamtheit muss exakt definiert sein (Es muss klar festgelegt werden, welche Elemente zur Stichprobe gehöhren) Die Grundgesamtheit muss physisch oder symbolisch präsent und manupilierbar sein (Bsp: Lottoziehung - sie muss sich durchmischen lassen und jedes Element muss entnehmbar sein) Jedes Element darf nur einmal in der Grundgesamtheit vertreten sein (man darf also nicht die gleiche Person zweimal mit dem gleichen Fragebogen befragen) Die Auswahl muss so erfolgen, dass jedes Element die gleiche berechenbare Auswahlchance (größer 0) hat, in die Stichprobe zu gelangen. (zB. ältere Menschen in Discos - Befragung findet ausschließlich an Orten oder zu Zeitpunkten statt, an welchen ein Teil der Grundpopulation selten oder nicht erreichbar ist.)
  • Was ist der methodische Hintergedanke für eine Parallelisierung? Beschreiben Sie den Unterschied zwischen unabhängigen und abhängigen Stichproben hinsichtlich der statistischen Power (1-Beta). Vergleichbare Untersuchsgruppen hinsichtlich interessierenden Merkmals (zB. Behandlungsgruppe & Kontrollgruppe) Ich führe Vortestung auf Bildung und Alter durch und dann suche ich Paare, die sich sehr ähneln; bei kleinen Stichproben matched samples Die Teststärke eines Tests ist die Wahrscheinlichkeit, die H1 anzunehmen, wenn sie auch wirklich gilt. Sie ist die Gegenwahrscheinlichkeit zum ß-Fehler. Die Teststärke 1-ß beschreibt also die Wahrscheinlichkeit einen Effekt zu finden, falls er tatsächlich existiert
  • Beschreiben Sie den Zusammenhang zwischen Effektgröße, Signifikanzniveau, Power und Stichprobengröße. Effektgröße: gibt Auskunft über inhaltliche Bedeutsamkeit (zb. Wie hoch ist der Zusammenhang) Ergänzung zur Signifikanztestung unstandardisierte und standardisierte Größen Cohens d (d-Maße) - Mittelwertsunterschiede Pearson-Korrelation (r-Maße) Eta2 (Varianzaufklärungsmaße) Odds Ratio und Risk Ratio Signifikanzniveau: Unterschiede zwischen Messgrößen oder Variablen in der Statistik werden als signifikant bezeichnet, wenn die Wahrscheinlichkeit, dass sie durch Zufall gerart zustande kommen würden, nicht über einer gewissen (meist 5%) Schwelle liegt. Je kleiner α, desto höher ist die Informationsqualität Teststärke: Die Teststärke eines Tests ist die Wahrscheinlichkeit, die H1 anzunehmen, wenn sie auch wirklich gilt. Sie ist die Gegenwahrscheinlichkeit zum β-Fehler. Die Teststärke (1-β) beschreibt also die Wahrscheinlichkeit einen Effekt zu finden, falles er tatsächlich existiert
  • Wie kann man bei der Ermittlung der "optimalen" Stichprobengröße vorgehen? Welche Schwierigkeiten bestehen dabei? Man muss die optimale Stichprobengröße im Wechselspiel mit α, 1-β und ε (Effektgröße) berechnen.-> G*Power Schwierigkeiten können zB. entstehen, wenn sich die Verteilung des Merkmals unter Ho und H1 nicht nur im Mittelwert sondern auch in der Varianz unterscheiden.
  • Beschreiben Sie eine Effektgröße ihrer Wahl näher. Odds-Ratio: Das Odds-Ratio oder auch Quotenverhältnis sagt etwas über die Stärke eines Zusammenhangs von zwei Merkmalen aus. Es ist ein Assoziationsmaß, bei dem zwei Odds miteinander verglichen werden.
  • Welche Möglichkeiten der Datenerhebung gibt es? Beschreiben Sie sowohl Vor als auch Nachteile der jeweiligen Methode. (Primär-versus Sekundärdaten) Primärdaten: müssen selbst erhoben werden (zB. Experiment, Beobachtungen) Vorteile: Daten sind aktuell, Quelle kann man vertrauen, da Daten selbst erhoben wurden Nachteile: großer Zeitaufwand und hohe Kosten Sekundärdaten: Daten wurden im Vorfeld schon einmal erhoben und diese werden dann weiterverwendet. (zB. Statistik Austria) Vorteile: Daten sind schnell und günstig verfügbar Nachteile: Daten sind womöglich nicht mehr aktuell, Datenqualität kann angezweifelt werden, da man diese nicht selbst erhoben hat
  • Nennen Sie einige typische Fehler der Fragebogenkonstruktion, die man vermeiden sollte. Vermieden werden sollen: lange, komplexe oder verschachtelte Fragen hypothetische Fragen doppelte Verneinung Lege jedem Item nur einen Gedanken zugrunde (Ich fahre gerne und schnell Auto) Verallgemeinerungen Suggestivfragen (Wissenschaftler sind der Ansicht, dass ... Stimmen Sie dieser Ansicht zu?) Begriffe wie "immer", "alles", "keiner", "niemals" quantifizierende Umschreibungen mit Häufigkeitsrating -> fast, kaum, selten -> besser 1-5 trifft zu oder nicht
  • Welche Informationen liefert die Berechnung eines (multiplen) linearen Regressionsmodells? Es liefert Information über die Form des Zusammenhangs 2er oder mehrerer Variablen Infos darfüber, ob sich eine Variable durch die andere erklären lässt und wie stark eine die andere beeinflusst
  • Nenne Sie Beispiel für Anwendungen von (multiplen) linearen Regressionsmodellen. Wenn ich meine Werbungskosten um 10% reduziere, um wie viel wird der Absatz sinken? Hängt der Absatz meines Produktes von den Werbungskosten ab? Wie stark ist der Zusammenhang?
  • Welche Möglichkeiten bestehen mehrstufige nominale oder Ordinate Variablen in die Regression aufzunehmen? Wie sind die zugehörigen Regressionskoeffizienten zu interpretieren? in Form von Dummy Variablen = dichotome normalskalierte Zahlen, wenn mehr als 2 Ausprägungen vorliegen dabei können durch diese Dummy Variablen die Auswirkungen qualitativer Unterschiede untersucht werden Bsp: Ob und wie ändert sich die marginale Konsumneigung nach einer Steuerreform?
  • Welche Methode zur Bestimmung der Regressionsfunktion wurde in der LV besprochen? Erklären Sie diese Methode anhand einer Skizze! Methode anhand eines Streudiagrammes Das Streudiagramm erklärt den Zusammenhang zwischen 2 Variablen. Wenn die Punkte nicht auf der Geraden liegen, dann besteht ein negativer Zusammenhang, wenn sie auf der Geraden liegen, besteht ein positiver
  • Welche Tests werden im Zusammenhang mit der linearen Regression durchgeführt. Welche Aufgaben haben diese? F-Test (Goodness of Fit) Überprüfung der Signifikanz des gesamten Modells Das Modell ist aussagekräftig, wenn die erklärte Varianz signifikant größer als die Fehlervarianz ist T-Test der Regressionskoeffizienten Überprüfung der Signifikanz einzelner Faktoren Es geht darum abzuklären, ob die berechneten Koeffizienten auch tatsächlich einen Beitrag zur Erklärung der abhängigen Variable leisten KS-Test Bei Multilinearer regression um die Normalverteilung der Residuen zu testen