MV (Subject) / Multivariate Verteilungen (Lesson)
There are 12 cards in this lesson
Grundbegriffe und co
This lesson was created by makem.
- Arten von Normalverteilungen Diskrete Verteilungen Kontinuierliche Verteilungen Unterscheidung univariate, bivariate und multivariate Verteilung
- Diskrete Verteilungen Es sind keine kontinuierlichen Werte für die Zufallsvariablen möglich, d.h. zur Benennung ihrer Ausprägungen genügt die Menge der natürlichen Zahlen. Beispielsweise sind bei einem Würfel nur ganzzahlige Augenzahlen von 1 bis 6 möglich. Beispiele: Bernoulli-Verteilung, Poisson-Verteilung
- Kontinuierliche Verteilungen Gaußsche Normalverteilung Es sind kontinuierliche Werte für die Zufallsvariablen möglich d.h. zur Benennung ihrer Ausprägungen ist die Menge der rationalen Zahlen notwendig (z.B. Dezimalbrüche mit unendlich vielen Nachkommastellen). Studentsche t-Verteilung, F-Verteilung von Fisher, Pearson χ2 -Verteilung, Cauchys Verteilung, Gammaverteilung, Betaverteilung, Weibull-Verteilung
- Unterscheidung univariate, bivariate und multivariate Verteilung Univariat Verteilung = Messgröße eindimensional Bivariate Verteilung = Messgröße zweidimensional → Verteilung einesZufallsvektors/Zufallsvariable deren Werte Vektoren im (n = 2) Multivariate Verteilung = Messgröße mehrdimensional
- Univariat Verteilung Keine gegenseitige Beeinflussung der Variablen → unabhängig Darstellung in zweidimensionalem Koordinatensystem (x-Achse Ausprägung der Zufallsvariablen, y-Achse Beobachtungswahrscheinlichkeit der Ausprägung)
- Multivariate Verteilung Wechselwirkung zwischen Variablen berücksichtigt → abhängig Wahrscheinlichkeitsbetrachtung für mehrere Variablen gleichzeitig Darstellung in dreidimensionalem Koordinatensystem (x-Achse Ausprägung der Zufallsvariablen, y-Achse Beobachtungswahrscheinlichkeit der Ausprägung, z-Achse )
- Euklidische Distanz Im zweidimensionalen Raum (für univariate/bivariate Daten): Berechnung von Unterschieden zwischen Größen. Da hierbei keine Zusammenhänge und Variabilität der Variablen berücksichtigt wird, sondern die Variablen gleich behandelt werden, nicht für multivariate Daten einsetzbar. - würde bei multivariaten Daten zu einer verzerrten Beurteilung der Abstände führen, d.h. man könnte die Abstände nicht als Maße der Ähnlichkeit zwischen den Datenpunkten heranziehen.
- Mahalanobis-Distanz behebt die Defizite der euklidischen Distanz für multivariate Daten (diemultivariaten Daten werden sozusagen in univariate Daten überführt). Es werden die Varianz sowie Kovarianz zwischen den Variablen berücksichtigt, indem die Kovarianzmatrix der Popolation (Σ) zur Bestimmung der Distanz verwendet wird. Wenn die Kovarianzmatrix Σp×p der Einheitsmatrix entspricht, dann entspricht die Mahalanobis-Distanz der quadrierten euklidischen Distanz.
- Stochastische Abhängigkeit und Korrelation Die Korrelation zweier Variablen enthält nur Informationen über ihre lineare Abhängigkeit. 1) Korrelation von 1 → perfekt positiver linearer Zusammenhang zwischen den Variablen2) Korrelation von 0 → kein linearer Zusammenhang zwischen den Variablen3) Korrelation von -1 → perfekt negativer linearer Zusammenhang zwischen den Variablen Eine Korrelation von Null bedeutet nicht, dass beide Variablen stochastisch voneinander unabhängig sind, sondern bedeutet nur, dass es keinen linearen Zusammenhang zwischen den Variablen gibt. Stochastische Unabhängigkeit bedeutet, dass zwischen Variablen kein Zusammenhang vorliegt.
- Unter welchen Bedingungen liegt eine Korrelation den Daten zugrunde? Nur wenn die Daten im Streudiagramm eine Isoellipse zeigen, deren Hauptachsen nicht parallel zu den Koordinatenachsen liegen , liegt eine Korrelation zwischen den Variablen vor.
- Multivariate Normalverteilung = die resultierende Verteilung bei gemeinsamer Betrachtung von Ausprägungen auf mehreren Variablen entspricht multivariater Normalverteilung Wird durch Dichtefunktion bestimmt
- univariater Normalverteilung die Verteilung der Ausprägungen einer Variable entsprechen einer Normalverteilung
