Modul 2 33209 CD Grundlagen deskriptiver Statistik (Fach) / 5. Empirische Verteilung multivariater Daten (Lektion)

In dieser Lektion befinden sich 8 Karteikarten

empirische Verteilung multivariater Daten

Diese Lektion wurde von HSchorr erstellt.

Lektion lernen

Diese Lektion ist leider nicht zum lernen freigegeben.

  • Urlisten (mehrere Merkmale -> mehrdimensionale UL) Bei einer statistischen Einheit interessiert man sich häufig nicht nur für eine einzige Eigenschaft, sondern für mehrere Merkmale. Die beobachteten Ausprägungen der untersuchten Merkmale konstituieren eine mehrdimensionale Urliste.
  • Aufbereitung multivariater Urlisten (Kontingenztabellen; Streudiagrammen) Jede multivariate Urliste lässt sich in Tabellenform präsentieren. Man erhält dabei - unabhängig vom Merkmalstyp - i. a. unübersichtliche Zahlenkolonnen. Bei multivariaten Urlisten für Merkmale mit nur wenigen Ausprägungen bietet es sich an, die beobachteten Ausprägungskombinationen zu zählen und mit einer aggregierten Tabelle zu arbeiten - Kontingenztabellen im bivariaten Fall. Bei Merkmalen mit vielen Ausprägungen kann man die Urlistenelemente - zumindest im bi- und trivariaten Fall - direkt in Form von Streudiagrammen grafisch darstellen.
  • Bivariate Häufigkeitsverteilungen Bei bivariaten Urlisten für Merkmale mit nur wenigen Ausprägungen ist es zweckmäßig, die in den Merkmalspaaren enthaltene Information durch Angabe absoluter Häufigkeiten oder relativer Häufigkeiten für alle Kombinationen von Merkmalsausprägungen zusammenzufassen. Mit diesen Häufigkeiten ist eine gemeinsame Häufigkeitsverteilung oder empirische Verteilung der beiden Einzelmerkmale definiert.
  • Kontingenztabellen (Die Darstellung der gemeinsamen Häufigkeiten zweier Merkmale) Die Darstellung der gemeinsamen Häufigkeiten zweier Merkmale mit k bzw. m Ausprägungen in Form einer Matrix heißt (k x m) - Kontingenztabelle oder - kürzer - Kontingenztabelle. Diese kann man für absolute oder für relative Häufigkeiten aufstellen. Eine Kontingenztabelle ist also eine tabellarische Darstellung einer bivariaten Häufigkeitsverteilung. Analog zum univariaten Fall lässt sich auch die in einer Kontingenztabelle enthaltene Information grafisch aufbereiten. Man verwendet hierfür dreidimensionale Stabdiagramme oder Histogramme.
  • Randverteilungen Eine (k x m) - Kontingenztabelle lässt sich noch ergänzen durch Angabe der Summen der k Zeilen und der m Spalten, der sogenannten Randhäufigkeiten der Einzelmerkmale. Die k bzw. m Randhäufigkeiten definieren jeweils eine Randverteilung.
  • Bedingte Häufigkeitsverteilungen Bei der Analyse der - in Form einer (k x m)-Kontingenztabelle vorliegenden - gemeinsamen Häufigkeiten zweier Merkmale interessiert man sich oft für die relativen Häufigkeiten der beobachteten Ausprägungen a1, ..., ak des einen Merkmals bei gegebener Ausprägung bj des anderen Merkmals. Diese Häufigkeiten heißen bedingte Häufigkeiten. Sie definieren jeweils eine univariate empirische Verteilung, die man bedingte Häufigkeitsverteilung nennt.
  • Streudiagramme Bei bi- und trivariaten Urlisten für Merkmale mit vielen Ausprägungen lassen sich die Urlistenelemente als Punkte in der Ebene oder im Raum interpretieren und in Form von Streudiagrammen grafisch darstellen. Bei höherdimensionalen Urlisten kann man je zwei Merkmale auswählen und deren Streudiagramme in Matrixform zusammenstellen. Solche Streudiagramm-Matrizen sind leistungsfähige Instrumente der explorativen Datenanalyse.
  • Lernerfolgskontrolle Berechnung bedingter Häufigkeitsverteilungen Bei einer Marktanalyse werden männlichen und weiblichen Personen drei Varianten A, B und C eines Produkts vorgelegt und die jeweils präferierte Produktvariante erfragt. Geben Sie die Befragungsergebnisse vor und ermitteln Sie die bedingten Häufigkeitsverteilungen. In Übung 1 ist die bedingte Häufigkeitsverteilung des Merkmals "Produktvariante Y" und in Übung 2 die des Merkmals "Geschlecht X der befragten Person" zu bestimmen.