Statistik 1 (Fach) / Grundlagen (Lektion)

In dieser Lektion befinden sich 32 Karteikarten

Deskriptive Verfahren

Diese Lektion wurde von gimleeundgrace erstellt.

Lektion lernen

Diese Lektion ist leider nicht zum lernen freigegeben.

  • Welche Rolle spielt Statistik in der Psychologie? Psychologie ist eine empirische Wissenschaft, d. h. Theorien und Hypothesen werden durch Studien nachgeprüft. Zur Auswertung werden Statistikkenntnisse benötigt. Ebenso werden durch die statistische Bewertung Fehler bei der Testauswertung frühzeitig erkannt und können behoben werden. Bsp. Simpson - Paradox
  • Was ist der Unterschied Stichprobe - Population? Eine Stichprobe ist eine Teilmenge aus der Grundgesamtheit. Die Grundgesamtheit nennt man auch Population. Eine Erfassung einer gesamten Population in Studien ist oft sehr schwer und deshalb nutzt man Stichproben.
  • Was ist der Unterschied - deskriptive Statistik - Interferenzstatistik? Bei der deskriptiven Statistik geht es um die Beschreibung einzelner oder mehrer Variablen, anhand von Tabellen, Grafiken oder Koeffizienten.  Bei der Interferenzstatistik geht es um die Schätzung von Parametern oder um Hypothesentests, basierend auf die Ergebnisse der beschreibenden Statistik.
  • Warum ist die Bestimmung des Skalenniveaus von Bedeutung? Das Skalenniveau hilft angemessene Tests zu finden um Variablen auswerten zu können und gibt den Informationsgehalt einer Messung an
  • Welches Skalenniveau gibt es? Nominal-Ordinal-Intervall-Ratioskalenniveau
  • Sensitivität - Spezifität , am Beispiel von erkrankten Personen die Diagnose erhalten haben erklärt Test für Krankheit Sensitivität: gibt an: den Anteil aller erkrankten Personen, die die richtige Diagnose erhalten haben (also krank) Spezifität: gibt an: den Anteil aller richtig diagnostizierten Personen an, die gesund sind.
  • qualitiative - quantitative Variablen Nominal - Qualitiativ Intervall, Ratio - Quantitativ Ordinal, schwierig, da Rangordnung vorhanden aber keine Abstände interpretiert werden können.
  • Diskrete/stetige Variablen diskret: Nominal- ordinalskalierte Variablen stetige Variablen: die Menge der Werte ist nicht abzählbar z.B. Größe und Gewicht Es können zwischen zwei Werten unendlich viele andere Werte liegen.
  • Warum haben Schuhgröße 33 träger eine längere Lebenserwartung als Leute mit Schuhgröße 44 Drittvariable! Schuhgröße Variable 1Lebenserwartung Variable 2 es kommt aber noch eine weitere Variable hinzu, nämlich Schuhgröße und Alter, sind korreliert.denn Größe 33 tragen zumeist nur kinder und somit haben wir den Zusammenhang zur Lebenserwartung. Das heißt der gemeinsame Einfluss der beiden Merkmale spielt eine Rolle in bezug auf die Lebenserwartung
  • Was ist eine Häufigkeitsverteilung? Was ist die absolute, relative und kummulierte Häufigkeit? Die Häufigkeitsverteilung gibt an wie sich die beobachteten Werte über den möglichen Wertebereich verteilen. absolut: ist die Anzahl der statistischen Einheiten in einer Stichprobe relative Häufigkeit: absolute Häufigkeit durch den Stichprobenumfang geteilt. Setzt somit die absolute Häufigkeit einer Ausprägung in Beziehung zur gesamten Stichprobe. kummulierte Häufigkeiten:- Berechnung möglich, wenn die Ausprägungn der Variablen in eine Reihenfolge gebracht werden können.- somit mindestens Ordinalskalenniveau - die Verteilung der k. relativen Hfkten werdenauch empirische Verteilungsfunktion genannt.
  • Was sind rechtsschiefe Verteilungen Bei rechtsschiefen, linkssteilen Häufigkeitsverteilungen liegt die Konzentrierung der Daten auf der linken Seite.
  • Was ist das arithmetische Mittel = Mittelwert - für Intervall- und Ratioskalierte Variablen Ausnahme, um Mittelwert sinnvoll zu interpretieren:dichotome Variablen (=binäre Variablen) sind nominalskalierte Variablen mit 2 Ausprägungen wenn z.B. männlich = 0 weiblich = 1 Der Mittelwert ist empflindlich für Ausreißer
  • Was ist der Median ist eine Maßzahl für die zentrale Tendenz von Variablen die mindestens Ordinalskalenniveau haben müssen. Gut geeignet für Ausreißer Betrachtet man die der größe nach geordneten Variablenwerte, so gilt für den Median: mindestens 50% der WErte sind kleiner/gleich dem Median und zugleich sind mindestens 50% größer/glelich dem Median.
  • Was ist der Modus? Der Modus ist ein Lagemaß, das schon für nominalskalierte Variablen sinnvoll ist. Ein Variablenwert dem der größten absoluten zbw. relativen Häufigkeit wird als Modus bezeichnet. Der Modus muss wie der Median nicht eindeutig sein.
  • Was sind Quantile =Eine Verallgemeinerung des Medians. SIe unterteilen die geordneten WErte einer Variablen in einem bestimmten, vorher festzulegenden Verhältnis. y.50 Mediany.25 unteres Quartily.75 oberes Quartily.10 y.20 Deziley.01 y.02 Perzentile
  • Wie Berechnet man Quantile Ist np ganzzahlig? ja: das Ergebnis ist der MIttelwert der (np)ten sowie der (np +1)ten Beobachtung in der geordneten Liste nein: Das ERgebnis befindet sich in der Liste der geordneten Beobachtungen an der Position die sich ergibt, wenn man np aufrundet.
  • Welche Statistiken sind für die Streuung relevant? -Spannweite- InterquartilabstandAbweichungsquadrate, Varianz, Standardabweichung
  • Was ist die Spannweite? = die Differenz zwischen dem größten und kleinsten Wert einer Variablen dr = ymax-ymin Aber:-nicht sehr informationshaltiges Streuungsmaß. Da er nur den mindestwert und den maximalwert beachtet und alle anderen dazwischen außer acht lässt. Was ist wenn diese Werte Ausreißer wären/sind? -die Spannweite der Stichprobe entspricht nicht der Spannweite der Population. Hier müssten die kleinsten und größten Werte der Population auch in der Stichprobe aufgenommenn werden.
  • Was ist der Interquartilabstand? Ein Streuungsmaß, das den Abstand zwichen den oberen und dem unteren Quartil erfasst, also somit die Streuung der mittleren Beobachtungen. dQ = y.75 - y.25
  • Womit erhält man wesentliche Informationen über eine Variable? Durch die 5 - Punkte-Zusammenfassung sie enthält: ymin, y.25, ymed, y75, ymax
  • Was sind Abweichungsquadrate? Damit kann man feststellen, wieviel die metrischen Variablen streuen. Das macht man, indem man die Abweichung der Beobachtungen vom Mittelwert verwendet und wird Summe der Abweichungsquadrate oder Variation genannt. SS = Σi=1n(y-y(mittelwert))2
  • Welchen Sinn hat die Variation bzw. warum ist sie vorteilhaft? weil die ABweichungsquadrate in verschiedene Anteile zerlegt werden können, um Vorhersagen für empirische Sachverhalte zu liefern. Seite 96 weiter recherchieren
  • WAs ist die Varianz? Streuungsmaß das unabhängig von der Stichprobe istProblem bei Variation:- bei Vergleich unterschiedlicher Stichproben - nur sinnvoll, wenn die Stichproben gleich groß sind- nimmt sehr große Werte an Varianz = s2 = SS/n-1
  • Was ist die Standardabweichung? Ist das Quadrat der Varianz. 'Da die Varianz folgendes Problem:Die Einheit der Varianz entspricht nicht der Einheit in der die Variable gemessen wurde. Beim messen der Größe in cm wäre die Einheit cm2 Deshalb Standardabweichung.- wenn Varianz oder Standardabweichung  = 0 keine Streuung- Je größer Streuung um Mittelwert, desto größer Streuung und Varianz.
  • Wie kann man die Schiefe einer Verteilung bestimmen? MIt Hilfe der Lageregeln Mittelwert größer Median größer Modus - rechtsschiefe VerteilungMIttelwert kleiner Median kleiner Modus - linksschiefe VerteilungMittelwert entspricht ungefähr) Median entspricht Modus - annähernd symmetrische Verteilung
  • Was ist der Schiefekoeffizient Zur berechnung der Schiefe metrischer Daten. Z.b. Folgender Koeffizientsiehe skript gm = 0  symmetrische Verteilunggm > 0 rechtsschiefe Verteilung - positive Schiefe
  • Was ist der Quartilskoeffizient der Schiefe? der Schiefekoeffizient hat einen Nachteil: er wird durch Ausreißer beeinflusst. Deshalb: Schiebekoeffizient basierend auf QuartilenVerteilung symmetrisch: Abstand zwischen unterem Quartil und Median = dem Median und dem oberen Quartil rechtsschief/linkssteil:Distanz zwischen oberem Quartil und Median ist größer als zwischen Median und unterem  Quartil. Formel im Skript
  • Bestimmen Sie das Skalenniveau für folgende Variablen und geben an ob qualitative oder Quantitate Variablen sind - Platz in der Bundesligatabelle - Lieblingsfarbe - Körpertemperatur Fiebermessen Celsius - Geschlecht - Reaktionszeit in einem Gedächtnis-Experiment -Ordinal - scheiden sich die Geister, da Reihenfolge möglich, aber keine Abstände, definierbar. qualitativ, scheinbar quantitativ- Nominal - qualitativ- Intervall - quantitativ- Nominal - qualitativ- Ratio - quantitativ
  • Warum ist die Einteilung von Variablen nach ihrem Skalenniveau bei der Auswertung empirischer Daten von Bedeutung Durch die Skalenniveuas erhält man Informationen der Variable und kann so einschätzen, welche weitere Verfahren möglich sind.
  • Welche Statistiken gibt es für die zentrale Tendenz Arithmetisches Mittel, Median, Modus(Quantile)
  • WElche Statistiken gibt es für die Streuung von Variablen Spannweite, Interquartilabstand, Abweichungsquadrate, Varianz, Standardabweichung
  • Welche Statistiken für die Schiefe einer Verteilung gibts Lageregeln, Schiefekoeffizient für metrische Variablen, Quartilskoeffizient der Schiefe