Methodenlehre II (Subject) / Methodenlehre II (Lesson)

There are 89 cards in this lesson

Methodenlehre II

This lesson was created by VIELWEIBEREI.

Learn lesson

  • Eine mögliche Alternative zum Signifikanztesten sind Konfidenzintervalle - nennen sie deren Vorteile! Vorteile von Konfidenzintervallen: enthalten dieselben Informationen wie Signifikanztests(signifikant / nicht signifikant) bieten Schätzungen des entsprechenden Populationsparameters(Mittelwert des Intervalls) zusätzliche Aussagen über Genauigkeit der Schätzung, durch die Länge des Intervalls
  • Warum werden zusätzlich zu verschiedenen Signifikanztests Effektgrößen verwendet? Grüdne warum zusätzlich Signifikanztests Effektgrößen verwendet werden: Effektgrößen ermöglichen Vergleich durch skalierte Messwerte bieten eine genaue Schätzung von Populationsparametern durch Aggregation (Metaanalyse) an
  • Was beschreiben die Begriffe interne und externe Validität? Interne Validität gibt an, inwiewieit Ergebnisse einer Untersuchung auf die Manipulation einer UV zurückgeführt und mögliche Störeinflüsse ausgeschlossen werden können (da selten, bis nie alle Störvariablen erfasst werden können, da sie beispielsweise gar nicht alle bekannt sind, ist vollständige interne Validität letztendlich ein schweres bis unerreichbares Ziel Externe Validität bezeichnet die Generalisierbarkeit und Repräsentativität von Untersuchungsergebnissen. Das heißt, inwieweit von dem erhobenen Verhalten über die Untersuchungssituation, die Versuchspersonen und den Untersuchungszeitraum hinaus generalisiert werden kann
  • Wozu dient das Lowess-Verfahren? beschreiben sie das Vorgehen bei der Konstruktion einer Lowess-Kurve! Lowess-Verfahren ermöglicht eine Visualisierung des Zusammenhangs zweier Variablen, auch wenn diese nicht linear sind Vorgehen: Auswahl von Datenpunkten um einen x-Wert Gewichtung ausgewählter Datenpunkte anhand des Abstandes zum Ausgangswert Berechnung einer Regressionsgeraden für die ausgewählten, gewichteten Punkte Einzeichnen des durch die Regressiongerade vorhergesagten Punktes Wiederholung für alle Datenpunkte
  • Welche Bedeutung hat der Glättungsparameter f bei der Berechnung einer Lowess-Kurve? Welche Werte kann er annehmen? Was bedeuten sie Bedeutung des Glättungsparameter f bei Berechnung einer Lowess-Kurve: gibt den Anteil der in der Lowess-Prozedur einbezogenen Punkte an der Gesamtzahl der Punkte an kann Werte zwischen 0 und 1 annehmen f = 0⇒ es erfolgt keine Glättung f = 1⇒ Glättung der Lowess-Kurve ist maximal
  • Wozu dient die Potenzleiter? Funktion der Potenzleiter: ermöglicht es Rechenverfahren für lineare Zusammenhänge auch auf nichtlineare Zusammenhänge anzuwenden, ... ... indem nichtlinearer Zusammenhang durch Änderung der Potenz transformiert wird
  • Worin unterscheiden sich Partialkorrelation und Pearson-Korrelationskoeffizienten? Welcher Zusammenhang besteht zu den Residualwerten der linearen Regression? Pearson-Korrelationgibt die Stärke des Zusammenhangs zweier Variablen an, ohne Rücksicht auf weitere Variablen zu nehmen PartialkorrelationStärke des Zusammenhangs wird bestimmt, wobei der Einfluss einer Drittvariable herausgerechnet wird Partialkorrelation kann auch als Pearson-Korrelation der Residualwerte berechnet werden
  • Klimaforscher fanden im Zuge einer Untersuchung zur Ursache der globalen Erwärmung folgenden Zusammenhang: Es besteht eine starke negative Korrelation zwischen der globalen Durchschnittstemperatur und der Anzahl an Piraten weltweit. Als mögliche Erklärung dieses Zusammenhangs kommt der weltweite durchschnittliche Industrialisierungsgrad infrage, der Einfluss auf beide Größen haben könnte. Um diese Erklärung zu überprüfen, wurden die jeweiligen Korrelationen über 10 Jahre berechnet. Wie kann bestimmt werden, wie groß der Zusammenhang zwischen der Zahl der Piraten und der globalen Durchschnittstemperatur ist, wenn man den Einfluss der Industrialisierung herausrechnet? Partialkorrelation (rxy.z)
  • Dem SPSS-Ouput einer multiplen Regression entnehmen sie folgende Werte: multiple Determinationskoeffizient R² = 0,238 multiple Korrelationskoeffizient R = 0,448 Standardschätzfehler = 0,653 F(4,420) = 32,854, p = ,002 Welche Aussagen können anhand der Daten bezüglich der Güte des linearen Modells gemacht werden? multipler Determinationskoeffizient R² = 0,238 23,8% der Varianz kann durch Prädiktoren aufgeklärt werden (hier exemplarisch): soziale Stressoren mit Klienten Arbeitsintensität Tätigkeitsspielraum Innovationsklima multipler Korrelationskoeffizient R = 0,448 (als relativ hoch anzusehen) eine Übereinstimmung zwischen geschätzten und tatsächlichen Werten ist recht hoch Standardschätzfehler vorhergesagte Werte weichen im Durchschnitt um .65 von den tatsächlichen Werten ab Gesamtvorhersage, welche sich auf das gesamte Modell (mit Kriterium und allen Prädiktoren bezieht) ist signifikant: F(4,420) = 32,854, p = ,002
  • Wie lautet die allgemeine Form der Regressionsgleichung in der multiplen Regression? y(geschätzt)i = b0 + b1 * x1i + b2 * x2i + b3 * x3i + b4 * x4i
  • Erläutern sie den Unterschied zwischen: multiplem Korrelationskoeffizienten, multiplem Determinationskoeffizienten und und Standardschätzfehler! multipler Korrelationskoeffizient (R) bezieht sich auf  Korrelation zwischen geschätzten / vorhergesagten Werten des Kriteriums und tatsächlichen / erhobenen Werten des Kriteriums multipler Determinationkoeffizient (R²) bezieht sich auf Anteil der Varianz, der durch Prädiktoren aufgeklärt werden kann⇒ "Zu wie viel % sind meine Prädiktoren Ursache meiner Variation im      Kriterium?" Standardschätzfehler (SE) gibt an, wie stark vorhergesagte Werte im Durchschnitt von tatsächlichen Werten abweichen je kleiner, desto weniger weichen vorhergesagte und tatsächliche Werte voneinander ab
  • Sie haben folgende multiple Regressionsgleichung berechnet: y(geschätzt)i = 42 + 12 * x1i - 5 * x2i - 3,5 * x3i y(geschätzt)i: Anzahl Psychologieabsolventen pro Semester x1: Anzahl eingeschriebener Psychologiestudenten x2:Schwere Prüfungen x3: Anzahl Studenten im Auslandssemester a) Was ist in diesem Beipiel: - Kriterium - Prädiktor - Konstante - Standardfehler? b) Welcher der Prädiktoren hat den größten Einfluss auf das Kriterium? a) Kriterium Anzahl der Absolventen Prädiktoren Anzahl eingeschriebener Psychologiestudenten Schwere Prüfungen Studenten in Auslandssemester Konstante 42 Standardfehler nicht in Formel enthalten! b) Aus der Regressionsgleichung allein kann nicht abgeleitet werden, welcher Prädiktor den größten Einfluss hat Es handelt sich um Originalwerte, die demnach von den Einheiten abhängig sindFür die Einschätzung der Prädiktoren werden die standardisierten β's benötigt(sind in der Gleichung mit den Originalwerten jedoch nicht gegeben)Zum anderen werden p-Werte der t-Tests benötigt, mit deren Hilfe geschaut geprüft werden kann, ob Einflusse der Prädiktoren signifikant sind
  • 5) Welche der folgenden Aussagen trifft sowohl auf die einfache lineare als auch auf die multiple lineare Regression zu? a) Der vorhergesagte Wert setzt sich aus dem tatsächlichen Wert und dem Fehler zusammen. b) Die Vorhersagekraft der einfachen linearen Regression ist genauso hoch wie die der multiplen linearen Regression. c) Das Ziel beider Verfahren ist die Vorhersage des Kriteriums. d) Für einfache und multiple Regression benötigt man mindestens zwei Prädiktoren. a, c
  • Ordnen sie die explorative Datenanalyse in den Kontext von deskriptiver und Inferenzstatistik ein! Wofür sind Verfahren der EDA wichtig? Explorative Datenanalyse (EDA):⇒ Verbindungsglied zwischen deskriptiver und Inferenzstatistik befasst sich mit graphischer Darstellung der Stichprobendaten⇒ deskriptiv (beschreibend) Ganze Verteilung der Daten wird dargestellt, nicht nur die Kennwerte geht über die reine Beschreibung der Daten hinaus, man kann man kann bei geeigneter Darstellung erkennen, ob Hypothesen zutreffen könnten und ⇒ ansatzweise inferenzstatistisch ... zusätzlich nach unvermuteten Mustern oder Auffälligkeiten in den Daten suchen⇒ explorativ (erkundend) Verfahren der EDA sind wichtig für deskriptive und Inferenzstatistik, um Sinnhaftigkeit der Berechnung von Kennwerten / Anwendung statistischer Tests zu ermitteln Mittellwert repräsentativ, Streuungsdiagramm → linearer Zusammenhang (Korrelation) ... deskriptive Statistik es geht darum, Daten der Stichprobe zu beschreiben dazu werden Kennwerte der Stichprobe: Lagemaße/Streuungsmaße genutzt Inferenzstatistik über Signifikanztests wird versucht Rückschlüsse (=Inferenzen) von einer Stichprobe auf die Population zu ziehen hierbei werden also Hypothesen getestet, meist (bei parametrischen Tests) anhand der Stichprobenkennwerte
  • Nennen sie Verfahren der explorativen Datenanalyse, die in der Vorlesung behandelt wurden! Zur Darstellung von ... a) einer Variable b) zwei Variablen c) drei Variablen (allgemein/speziell zur Gruppierung der Personen oder Objekte) d) > 3 Variablen (allgemein/speziell zur Gruppierung der Personen oder Objekte) Zur Darstellung von ... ... einer Variable Box-Plot Stamm-Blatt-Diagramm Q-Plot Q-Q-Plot (empirische/theoretische Verteilung) P-Plot ... zwei Variablen Back-to-Back Stamm-Blatt-Diagram (wenn 2. Variable dichotom) Box-Plot (wenn 2. Variable diskret) StreuungsdiagrammSonnenblumendiagramm kartesisch oder polar mit Box-Plots mit Konfidenzlinien (der Regressionsgeraden) LOWESS & Potenzleiter Influence-Plot Q-Q-Plot (zwei emp. Verteilungen) ...drei Variablen allgemein 3-dimensionales Streuungsdiagramm Bubble-Plot Mosaikplot Konturplot DWLS speziell zur Gruppierung der Personen oder Objekten Rechteck-Icons (Starplot) (Chernoff-Gesichter) (Histogramm-Plot) (Profil-Plot) ... > drei Variablen allgemein Streuungsdiagramm-Matrix speziell zur Gruppierung der Personen oder Objekten Starplot Chernoff-Gesichter Histogramm-Plot Profil-Plot
  • Was wird in folgenden Plots dargestellt und wozu dienen sie: a) Influence-Plot b) Bubble-Plot Influence-Plot Einfluss einzelner Datenpunkte auf den linearen Zusammenhang zweier Variablen wird dargestellt dabei werden Variablen in einem Streuungsdiagramm abgetragen, mit derBesonderheit, dass die Datenpunkte unterschiedlich groß und gefüllt oder ungefüllt sind Anhand der Größe eines Punktes kann man erkennen, wie stark sich die Korrelation bei Entfernung des Punktes verändern würde Füllung des Punktes gibt die Richtung der Änderung an Influence Plot dient zur Identifikation von Punkten, die einen starken Einflluss auf die Korrelation haben diese sollten keine Ausreßer sein (wenn doch entfernen) sondern Punkte, auf denen mehrere Personen liegen Bubble-Plot Zusammenhang von drei Variablen wird veranschaulicht ... um herauszufinden, ob ein bivariater Zusammenhang relativiert werden muss, weil er durch Drittvariable beeinflusst wird Streudiagramm von zwei Variablen dritte Variable wird als Größe der Datenpunkte dargestellt
  • 1) Welche der folgenden Aussagen ist richtig? a) Bei einer Faktorenanalyse werden ähnliche Versuchspersonen in homogene Gruppen zusammengefasst. b) Bei einer Faktorenanalyse werden Effektgrößen aus verschiedenen Studien zusammengefasst und analysiert. c) Durch eine Faktorenanalyse kann die Zahl der Variablen reduziert werden, indem neue Variablen geschaffen werden. d) Die Faktorenanalyse ist ein Verfahren, in dem Werte transformiert werden, um aus nichtlinearen Zusammenhängen lineare Zusammenhänge zu erzeugen. c
  • Was ist der Unterschied zwischen Hauptkomponentenanalyse und Hauptachsenanalyse? Hauptkomponentenanalyse Annahme: gesamte Varianz der Variablen kann durch die Faktoren aufgeklärt werden  Hauptachsenanalyse Ein Teil der Varianz kann nicht durch Faktoren aufgeklärt werden
  • Erklären sie folgende Kennwerte der Faktoranalyse: - Faktorwert - Eigenwert - Faktorladung - Kommunalität Faktorwert (Fki): Wert einer Person i auf einem Faktor k Eigenwert (sk²) Anteil, der durch Faktor k aufgeklärten Varianz an Gesamtvarianzaufklärung Faktorladung (aik) Korrelation von Werten von Variable j mit Werten von Faktor k Kommunalität (hj²) Anteil der Varianz der Variable j, der durch alle Faktoren aufgeklärt werden kann
  • Anhand welcher Kenngröße werden Faktoren ausgewählt? Erklären sie kurz Kaiser-Kriterium und Scree-Plot! Kenngröße, anhand derer Faktoren ausgewählt werden: Faktoren werden anhand des Eigenwertes ausgewählt Kaiser-Kriterium nur Faktoren mit einem Eigenwert > 1 sollen ausgewählt werden  Scree-Plot Eigenwerte der Faktoren werden nach der Größe sortiert und in ein Diagramm gezeichnet Nur Faktore, deren Eigenwerte oberhalb des Knicks in der Kurve liegen, werden ausgewählt
  • Was ist die Clusteranalyse? Was ist die Grundidee Clusteranalyse multivariates Verfahren, welches die Bündelung von Objekten anstrebt ihre Grundidee: eine heterogene Gesamtheit von Fällen (Personen/Objekten) wird in homogene Gruppen (Cluster) aufgeteilt ..... indem Ähnlichkeit einzelner Fälle untereinander in Bezug auf alle relevanten Variablen betrachtet wird
  • Skizzieren sie kurz das Vorgehen bei der Clusteranalyse! Vorgehen bei der Clusteranalyse Ähnlichkeit der Fälle Bestimmen  über Proximitätsmaß (Distanzmaß/Ähnlichkeitsmaß) für jeweils 2 Fälle Übereinstimmung/Unterschiedlichkeit in Bezug auf alle relevanten Merkmalsausprägungen bestimmen⇒ hierfür Maßzahlen ermitteltn Wählen des Fusionierungsalgorithmus (Clusteralgorithmus) Fusionierungsalgorithmen können hierarchisch oder partitionierend sein hierarchische Fusionierungsalorithmen⇒ weitere Unterteilung in agglomerative und divisive Fälle werden aufgrund des Fusionierungsalgorithmus anhand ihrer Proximitätswerte zusammengefasst Bestimmen der Clusterzahl abwägen zwischen: Ziel der Reduktion (wenige Cluster) hohe Lösungsgüte (viele Cluster) Möglichkeiten: Statistische Kriterien (Dendogramm) Heterogenitätsmaß inhaltliche Überlegungen Interpretieren der Cluster und Überprüfen der Güte Anzahl der Cluster ist für Lösungsgüte entscheidend Cluster sollten inhaltlich sinnvoll / interpretierbar sein⇒ inhaltliche Überprüfung Fälle in den Clustern zur Überprüfung der Güte der Clusterlösung, in Bezug auf Ausprägungen, die sie in relevanten Variablen haben, betrachten.(Mittelwerte/Boxplots über Personen/Variablen in jeweiligen Clustern)⇒ Inhaltlichen Bedeutung Herausfinden
  • Erklären Sie den Unterschied zwischen Between- und Within-Designs! [Wiederholung: Methoden I] Between-Designs eine experimentelle Bedingung pro Versuchsteilnehmer Within-Design mehrere experimentelle Bedingungen pro Versuchsteilnehmer ⇒ oft beides!
  • Was kann mittels Chi-Quadrat-Verfahren bei Untersuchung einer Variable überprüft werden? Chi²-Anpassungstest Übereinstimmung zwischen empirischer und theoretischer Verteilung der Variable⇒ in Nullhypothese wird theoretische Verteilung spezifiziert⇒ geprüft wird, ob vorliegende Daten dieser Verteilung entsprechen
  • Was kann mittels Chi²-Verfahren bei Untersuchung von zwei Variablen überprüft werden? Chi²-Anpassungstest Übereinstimmung zwischen empirischer und theoretischer Verteilung je Variable für Verteilung beider Variablen zusammen Chi²-Unabhängigkeitstest Zusammenhang zwischen 2 Variablen zur Prüfung, ob 2. Merkmale stochastisch unabhängig sind
  • Womit beschäftigt sich deskriptive Statistik? deskriptive Statistik mit dem beschreiben von Stichprobendaten mithilfe von Kennwerten der Stichprobe: Lagemaße / Streuungsmaße
  • Womit beschäftigt sich Inferenzstatistik? Inferenzstatistik Rüchschlüsse von der Stichprobe auf die Population Hypothesen testen anhand der Stichprobenkennwerte
  • Welche Vorteile ergeben sich bei abhängigen Stichproben? (im Sinne von within-subjects-Design) Vorteile perfekte Parallelisierung personengebundener Störvariablen⇒ verminderte Fehlervarianz ⇒ größere Power ökonomischer weniger Versuchspersonen, da diese mehrere Bedingungen durchlaufen sinnvoller, wenn es um Verhaltensänderungen von Personen im Verlauf der Zeit geht (unter Umständen ) gleicher Kontext⇒ kann bei Vergleichen wichtig sein Beispiel: Martforschungschwierig ein Produkt zu bewerten ohne Vergleich zu anderen besseren oder schlechteren Produkten (Kontext)
  • Wie hängen multipler Korrelationskoeffizient, multipler Determinationkoeffizient und Standardfehler (Gütemaße) miteinander zusammen? Zusammenhang:multipler Korrelationskoeffizient (R)multipler Determinationkoeffizient (R²)Standardfehler (SE) Wenn R hoch, dann R² hoch und SE klein ⇒ Regressionsmodell scheint genaue Schätzung zu liefern Wenn R niedrig ist, ist auch R² niedrig und SE groß⇒ Regressionsmodell scheint keine genaue Schätzung zu liefern
  • Warum ist es in der Regel nicht empfehlenswert, die Festlegung der Reihenfolge der Eingabe der Prädiktoren in einer hierarchischen Regression einer Statistiksoftware zu überlassen? Grund warum man Ermittlung der Reihenfolge der Prädiktoren in hierarchischer Regression keiner Statistiksoftware überlassen sollte: Software fügt denjenigen Prädiktor zuerst in das das Modell ein, der die höchste Erklärungskraft besitzt es handelt sich jedoch um Stichprobendaten⇒ Gefahr, dass dieser Prädiktor nur zufällig die größteErklärungskraft besitzt (könnte in anderer Stichprobe anders aussehen ) Problem besonders relevant, wenn verschiedene Prädiktoren sich in ihrer Erklärungskraft nicht stark unterscheiden⇒ Theoriegeleitetes Vorgehen bei Festlegung der Reihenfolge ist besser
  • Vergleiche die Verfahren Faktorenanalyse und Clusteranalyse bezüglich ihrer Unterschiede! Unterschiede: Faktorenanalyse ⇔ Clusteranalyse Was: Faktorenanalyse Variablen werden zu Faktoren zusammengefasst Clusteranalyse Fälle werden in Gruppen (Cluster) zusammengefasst Wie: Faktorenanalyse Variablen werden anhand ihrer Korrelationen (über Fälle) zueinander zu Faktoren zusammengefasst Clusteranalyse Fälle werden anhand ihrer Ähnlichkeiten (in den Ausprägungen der Variablen) zueinander gruppiert Wozu: Faktorenanalyse Dimensionsreduktion Clusteranalyse Gruppenbildung
  • Nennen und erläutern sie vier ihnen bekannte Streuungsmaße! Varianz (VA)durchschnittliche quadrierte Abweichung der Werte einer Variable vomMittelwert Standardabweichung (SD)durchschnittliche Abweichung einer Variable vom Mittelwert (quadrierte Werte der Varianz schwer zu interpretieren, deswegen wird die Wurzel der Varianz verwendet) Range/SpannweiteAbstand zwischen größtem und kleinstem Wert Interquartilsabstand (QA)Abstand zwischen oberem und unterem Quartil
  • Nennen und erklären Sie die verschiedenen Skalenniveaus! Nominal:(Un-)Gleichheit zwischen Objekten, Lagemaß: Modus Bsp.: Studiengang Ordinal:Rangreihe (größer, kleiner, gleich),keine Aussage über Größe der Abstände Lagemaß: Modus, Median Bsp.: Rang beim Militär Intervall:Gleichheit von Differenzen kein natürlicher Nullpunkt Lagemaß: Modus, Median, arithm. Mittelwert Bsp.: Temperatur in °C Verhältnis:Gleichheit von Verhältnissen(Gleichheit von Differenzen, natürlicher Nullpunkt) Lagemaß: wie Intervallskala Bsp.: Temperatur in Kelvin Absolut:natürliche Maßeinheit Bsp.: Häufigkeiten
  • Nennen und erläutern Sie vier Ihnen bekannte Lagemaße! Median:Wert in der Mitte aller Werte Modalwert:häufigster Wert Quantil:p-Quantil (p zwischen 0 und 1):Wert ≥ p·100% aller Werte(z. B. Median, oberes & unteres Quartil)Median: 0,5 Quantil oder 50%-Quantilunteres Quartil: 25% Quantil (Wert in der Mitte zw. kleinstem Wert und Median)oberes Quartil: 75% Quantil (Wert in der Mitte zw. größtem Wert und Median) arithmetisches Mittel: Quotient aus der Summe aller Werte durch die Anzahl aller Werte
  • Wieso kann man die explorative Datenanalyse als Verbindungsglied zwischen Deskriptiver- und Inferenzstatistik beschreiben Explorative Datenanalyse deskriptiv: graphische Darstellung der Stichprobendaten (beschreibend) inferenzstatistisch (ansatzweise) : macht Vermutungen über zutreffen/nicht zutreffen von Hypothesen möglich
  • Wie lassen sich Clusterverfahren hierarchisch aufgleidern? # Clusterverfahren Graphentheoretische Verfahren Hierarchische Verfahren agglomerativ single linkage complete linkage avergae linkage Centroid Median Ward divisiv Partitionierende Verfahren Austausch Verfahren Iteriertes Minimaldistanzverfahren Optimierungsverfahren
  • Wann ist ein Testergebnis signifikant? wenn p ≤ α
  • Sie haben zur Untersuchung Ihrer Fragestellung eine Experimental- und eine Kontrollgruppe mit jeweils 20 Teilnehmern verglichen. Zur statistischen Auswertung benutzen sie einen t-Test für unabhängige Mittelwertsunterschiede und finden: t(38)=2,7, p=.01 (gerundet). Bitte überlegen Sie, welche der folgenden Aussagen richtig und welche falsch sind. a)Sie haben bewiesen, dass die Nullhypothese (kein Unterschied zwischen den Populationsmitteln) nicht stimmt b)Sie haben die Wahrscheinlichkeit dafür gefunden, dass die Nullhypothese wahr ist. c)Sie haben bewiesen, dass Ihre Alternativhypothese (es gibt einen Unterschied zwischen den Populationsmitteln) stimmt. d)Sie können die Wahrscheinlichkeit dafür ableiten, dass die Alternativhypothese richtig ist. e)Sie kennen die Wahrscheinlichkeit dafür, dass Sie eine falsche Entscheidung treffen, wenn Sie sich entscheiden, die Nullhypothese zu verwerfen. f)Sie haben einen reliablen experimentellen Befund in dem Sinne, dass Sie, wenn das Experiment sehr oft repliziert würde, in ungefähr 99% der Fälle ein signifikantes Resultat erhalten würden. alle falsch! [?]
  • Nennen Sie die einzelnen Schritte des wissenschaftlichen Prozesses! ... Theorie → Forschungshypothese → statistische Hypothese → Design der Studie → Durchführung → Datenanalyse → Interpretation der Daten → Implikation für Theorie ...