Modell
-Was beinhaltet es?
-Vorhersage?
-beinhaltet alle signifikanten Einflussfaktoren -über Modell kann Antwortgröße vorhergesagt werden
Wodurch werden Messwerte bestimmt?
-Signal -Rauschen
Was ist die Differenz zwischen Messwerten und vorhergesagten Werten?
Schwankung, die nicht durch Modell erklärt werden kann Residuen
Wie werden Versuchspläne ausgewertet?
mit/ohne ZP
-ist abhängig von Versuchsdesign -mit Zentralpunkten: Krümmung, pure error, lack of fit -ohne: nur Residuen Modellabweichungen
Wie hängt die Wahl der Faktorstufen mit dem Signal-Rausch-Verhältnis zusammen?
klein/groß
-zu kleiner Abstand Faktorstufen: oft wird auch signifikanter Faktor nicht identifiziert -zu groß: signifikant aber oft unrealistische Annahmen
Was ist das Problem, wenn es keine Wiederholungsversuche gibt? Warum ZP?
-bei jedem Versuch Faktor unterschiedliche Ausprägung => pure error nicht berücksichtigt -bei ZPs zusätzlich Krümmung
Was sind Vorrausetzungen für ANOVA? Wann wird dies geprüft und wieso?
-Normalverteilung Residuen, konstante Varianz -nach ANOVA; kann erst mit Schätzfunktion passieren Vergleich Vorhersage mit MW
Def Residuen
Bild Formel
e = y - ȳ Abweichung der Messwerte vom vorhergesagten Wert Fehler nicht durch Modell erklärt
Wie können die Residuen auf Normalverteilung getestet werden?
-Normal plot of residuals Die Residuen der Größe nach auftragen => sie sollten auf linearisierten Normalverteilung liegen => leichte S-Form akzeptabel
Wie können Residuen auf konstante Varianz geprüft werden?
-Schwankungen bei kleinen und großen Werten gleiche Schwankungsbreite => Residuen werden gegen Schätzwert und gegen Faktorstufen
Definition R2 normales Bestimmtheitsmaß
R2 = SSModell / SSGesamt SSModell Abweichung vorhergesagter Werte vom Mittelwert SSGesamt Abweichung der gesamten Werte vom MW
Erklärte und unerklärte Abweichung Bestimmtheitsmaß
-erklärt: Anteil von Gesamt an Modell -Rest: ungeklärter Anteil Modell
Graphische Darstellung und Interpretation Bestimmtheitsmaß
-Gegenüberstellung Vorhersage und Messwerte -im Idealfall auf einer Linie
Was sieht man zusätzlich bei graphischer Darstellung R2?
ob der Fehler normalverteilt ist
Was ist das Problem bei dem normalem R2?
Je größer Anpassung desto besser R2 es wird nicht berücksichtigt wieviele Regressionskoeff Je mehr, desto höher R2
korrigiertes Bestimmtheitsmaß
SInn Def
-berücksichtigt Anzahl Faktoren, indem SS durch DF geteilt wird R2 = 1 - MSFehler / MSGesamt Je mehr Faktoren, desto geringer => Rausnehmen unnötiger => Verbesserung
Bestimmtheitsmaß der Vorhersage
Aussage, Fragestellung
Def
Aussage darüber, wie gut Modell Messwerte beschreibt Ist Regressionsgleichung geeignet, Werte vorherzusagen? R2 = 1 - PRESS / SSGesamt
Normierung PRESS-Wert
PRESS umso größer, je mehr Messwerte R2 (pred) = 1 - PRESS / SSgesamt
Je besser man mit Modell Werte vorhersagen kann...
desto größer ist R2 predicted
Was bedeutet ein negatives R2 pred?
der Mittelwert sagt Werte besser voraus Abweichung vom Modell ist größer als vom MW
Welche 5 weiteren Kenngrößen gibt es?
-Standardabweichung -Mittelwert -Variationskoeffizient -PRESS -adeq. Pecision
Residual vs Run
Prinzip
Aussage
Gründe
Grenzen
es werden Residuen gegen Runs aufgetragen => systematische Fehler im Verlauf -randomisierte Reihenfolge Gründe: Ermüdung Sensorik -keine Werte außerhalb roter Linien
Leverage vs. Run
-Was ist Leverage?
-Was gibt es an?
-Leverage = 1?
Grenze
-Leverage ist die Gewichtung -gibt an, wie stark ein Messwert die Modellanpassung beeinflusst -Leverage = 1: -Modell muss durch diesen Punkt gehen -Grenze rote Linie
Deletion Diagnostics
Grundprinzip
4 Diagnostics
Ein Messwert wird aus der Regression rausgenommen und Veränderung betrachtet -externally studentized residuals -DFFITS -DFBETAS -Cooks Distance
externally studentized residuals
-Prinzip
-Parameter und Einheit
-Grenze
-Wert weglassen, erneute Regression -Unterschied Messwert und neuer Schätzwert -in SD: wieviele SD dazwischen -rote Linie
Frage bei DFFITS und DFBETAs?
Wie ändert sich Anpassung / Regressionskoeffizienten wenn jeweils ein Wert rausgenommen wird
DFFITS
-Def
-Sinn
-Grenze
-Unterschied Schätzwert mit allen Werten zu Schätzwert ohne herausgenommen Wert -einzelne Werte sollten Anpassung nicht zu stark beeinflussen: kleine Differenze es gibt Liniengrenzen
DFBETAS
-Def
-Was wird getestet
-Grenzen
Unterschied der Regressionskoeffizienzen, wenn einzelner Wert aus Auswertung rausgenommen wird -Test für Achsenabschnitt und jeden Koeff einzelne Grafik -in Grenzen
Cooks distance
Def
wenn Punkte gleich gewichtet
Grenzen
Kombi aus Leverage und externally studentized residuals allle Punkte gleich gewichtet => Ausreißer auch in grenzen
Was tun wenn Messwert in Diagnostics abweicht? Ausreißer
-Tippfehler -Fehler Versuchsdurchführung -nicht identifizierte Einflüsse
Auffälligkeiten in DFBETAS, DFFITS?
-ggf bestimmte Effekte -bei zu hoher Gewichtung => schlechte Versuchsplanwahl Reduktion durch Wiederholungsversuche und andere Faktorstufen