MV (Subject) / Diskriminanzanalyse (Lesson)
There are 11 cards in this lesson
Lineare Diskriminanzanalyse
This lesson was created by makem.
- Ziel der Diskriminanzanalyse Bestimmung neuer Variablen mit denen Gruppen optimal getrennt werden können bzw. ermitteln eines Vektor w, der die Richtung der besten Trennung anzeigt. In diese Richtung gibt es im Optimalfall keine Überlappung der Gruppen. -> Es gilt die Überlappung als Trennungsgüte: Je kleiner die Überlappung der Gruppen, desto besser die Trennung.
- Bestandteile der Diskriminanzanalyse Menge von Datenpunkten,die durch die Variablen x1 und x2 beschrieben werden Bereitsdefinierte Gruppen (Gruppe1und Gruppe 2) Vektor w = Richtung der besten Trennung
- Unterschied zwischen LDA und FA Das Vorgehen zur Diskriminanzanalyse ähnelt sehr stark der Faktorenanalyse. Hauptunterschied: besteht in der Matrix, die schließlich für die Eigenwertberechnung verwendet wird. LDA: Die Bestimmung einer neuen Variable w, mit der bereits bestehende Gruppen so gut wie möglich getrennt werden können. Neue Variable w entsteht durch neue Variablenkombinationen. FA: Varianz der gesamten Stichprobe wird durch Projektion maximiert. Durch Definieren einer neuen Richtung w1 wird die größtmögliche Varianz der Daten ermittelt
- Voraussetzungen zur Durchführung einer Diskriminanzanalyse Varianzhomogenität der Gruppenpopulationen multivariate Normalverteilung SW (= Swithin ungefähre Streuung auf der neuen Variablen) ist positiv definiert und regulär/ invertierbar; SB (= Sbetween Standardabweichung zwischen den Gruppen) ist positiv definiert
- Unterschied zwischen Diskriminanz- und Clusteranalyse Clusteranalyse: die wirkliche Gruppenzugehörigkeit ist unbekannt und man versucht die Objekte in Gruppen einzuordnen → kurz: bilden/erzeugen von Gruppen Diskriminanzanalyse: die Gruppenzugehörigkeiten sind bekannt und man will die Gruppenunterschiede untersuchen oder neue Objekte in die bekannten Gruppen einordnen → kurz: untersuchen von Gruppen
- MANOVA gibt es Gruppenunterschiede zwischen mehreren AV´s? Ergebnis: es gibt Gruppenunterschiede Gruppenbildung UV: Gruppen nominal AV: Prädiktoren metrisch Spezialfall der kanonischen Korrelation Signifikanztest: Testen der UV auf Haupteffekte
- Diskriminanzanalyse Lässt sich aufgrund der AV vorhersagen zu welcher Gruppe ein Fall gehört? Ergebnis: WIe unterscheiden sich die Gruppen? gegebene Gruppenzugehörigkeit der Variablen UV´s: Prädiktoren metrisch AV´s: Gruppen nominal Spezialfall der kanonischen Korrelation Diskriminierungsfunktion bilden
- Durchführung der LDA bei zwei Gruppen Ziel der Diskriminanzanalyse/funktion: Ausmaß der Unterschiedlichkeit maximieren Differenz der Zentroide möglichst groß Überschneidungsbereich der Verteilung der Messwerte möglichst klein
- Einsatzgebiete der LDA Gesichtserkennung (Im Bereich Machine Learning wird LDA zur Pattern Recognition eingesetzt) Identifikation von Kundentypen im Marketing – nicht mehr üblich! Untersuchung der Molekülstruktur oder Patientengruppen in der Biomedizin Durchführung von Klassifizierungen (Beispiel: Fishers Blumen → Voronoi Diagramme, Mahalanobis Distanz, Minimum Distance Classification)
- kanonische Korrelation ist ein Maß für die wechselseitige Abhängigkeit zweier Gruppen von (Zufalls-)Variablen. Instrument der multivariaten Statistik der Analyse dieses Zusammenhangs.
- Welche Ergebnisse bezüglich der LDA sind optimal/ nicht optimal? Nicht optimal: Gruppen mit kleinem Mittelwertsabständen (= großer Kurvenüberlappung) und großer Streuung. Optimal: hohe Mittelwertsabstände mit geringer Streuung.