Statistik (Fach) / Vorraussetzungen (Lektion)

In dieser Lektion befinden sich 36 Karteikarten

sg

Diese Lektion wurde von allinspace erstellt.

Lektion lernen

Diese Lektion ist leider nicht zum lernen freigegeben.

  • Wahrscheinlichkeitsverteilung. Es gibt diskrete (abzählbare) und stetige/kont. (reelle) ZG. Die mögl. Werte bilden den Wertevorrat bzw. Merkmalraum. Um eine ZG sinnvoll zu beschreiben, muss man für jedes Ereignis die Wahrscheinlichkeit ...
  • Diskrete Gleichverteilung Für Diskrete Größen Versuch mit m gleichwahrscheinlichen Ausgängen
  • Alternativverteilung: Diskrete Merkmale Zufallsgröße kann nur ja/nein (0,1) annehmen.
  • Binominalverteilung: Diskrete ZG bei n-maliger Durchführung wird Auftreten eines Ereignisses E gezählt; Wiederholungen beeinflussen einander nicht -> sind unabhängig.
  • Hypergeometrische Verteilung Diskrete ZG : aus Grundmenge N (A Elemente besitzen Eigenschaft) werden n Einheiten auf einmal gezogen. Kleinere Varianz als Binominalvert, weil gleichviele oder mehr Einh. geprüft -> mehr Info!
  • Geometrische Verteilung: Diskrete G Versuch solange wiederholt, bis bestimmtes Ereignis E eintritt (z.B. Würfeln bis 6), einzelne Versuchswiederholungen sind unabhängig.
  • Poisson-Verteilung: Diskrete ZG Verteilung der seltenen Ereignisse. zB Anzahl eingehender Anrufe in Zeitspanne x, Anzahl Kleesamen in Volumseinheit Saatgut, Anzahl Druckfehler auf Buchseite: Anzahl X von Eintritten von ...
  • Stetige Gleichverteilung: Wahrscheinlichkeit hängt nur von Länge der Teilintervalle, nicht von Lage ab: Dichtefunktion ist konstant, Verteilungsfunktion stetig steigend.
  • Exponentialverteilung: Stetige ZG zB für Lebensdauerbeschreibung, Wertebereich M umfasst positive reelle Zahlen. Zusammenhang mit Poisson: wenn Anzahl X von Intervall t poissonsverteilt mit mü = lamda*t, dann ist Zeit Y ...
  • Normalverteilung/Gaußverteilung: Stetige ZG Wertebereich umfasst alle reellen Zahlen, Standardnormalverteilung (0,1) hat Mittelwert 0 und Varianz 1. Symmetrisch, Lineartransformationen normalverteilter ZGn führen auch zu Normalverteilungen. ...
  • Logarithmische Normalverteilung: Stetige ZG hängt eng mit Normalverteilung zusammen; ZG ist logaritm. nv, wenn ihr Logarithmus ln X(mü,Varianz) verteilt ist.
  • Chiquadrat-Verteilung X2f: Prüfverteilung mit f Freiheitsgraden: Y = X21…X2f wobei X2 die ZG sind; Wertebereich sind die positiven reellen Zahlen.
  • t-Verteilung/Student-Verteilung: Stetige ZG Prüfv, Y = Z/Wurzel(V/f), mit Z = standardnv ZG, V = eine mit f Freiheitsgraden X2-verteilte ZG, beide sind unabhängig! Symmetrische Verteilung
  • F-Verteilung: stetig Prüfv, Y = (V/f1)/(W/f2), V und W sind unabhängige X2-v ZG mit f1 bzw f2 Freiheitsgraden.
  • Korrelationskoeffizient Grenzwertsatz Korr: stellt linearen Zusammenhang zwischen X und Y dar, kann nur zwischen -1 und 1 liegen, bei |1| ist linearer ZH sicher. Bei 0 kein linearer Zusammenhang -> bei NormVert sind X und Y unabhängig. ...
  • Grundlagen der schließenden Statistik Grundlage: Stichprobe von identisch verteilten und unabhängigen Beobachtungen, also eine (ein- oder mehrdim) ZG mit einer VF Fx (zB normalverteilt, poissonverteilt). Diese ZG wird n-mal unabhängig voneinander ...
  • Maximum Likelihood Schätzung: Plausibilitätsmethode  ML-Schätzer sind asymptotisch erwartungstreu, asymptotisch effizient, und konsistent, und die Verteilung nähert sich mit wachsender Stichprobengröße an NVtl (Mittelwert 0, ...
  • Parameter der Normalverteilung: Mittelwert Mittelwert: ZG X ist normalverteilt, Standardabweichung entweder bekannt oder unbekannt. Vergleich zweier Mittelwerte: 2 Merkmale X, Y sind N(x,s2) verteilt und abhängig oder unabhängig. Unabhängig ...
  • Parameter der Normalverteilung: Varianz Varianz: normalverteilt Vergleich zweier Varianzen: zwei Merkmale X,Y sind unabhängig und N(x,s2)-verteilt! Bei zweiseitigen Tests ist cu kleiner und co größer als 1, Reihung der Stichproben muss also ...
  • Analyse von Anteilen Schätz- und Testverfahren für Wahrscheinlichkeit eines betrachteten Ereignisses A (z.B. Antwort JA) beruhen auf relativer Häufigkeit, die sich als Mittelwert einer Stichprobe dividiert durch alternativ-verteilte ...
  • Einfache Varianzanalyse: yij = müij + eij oder yij = mü + ai + eij y ist abhängig, e zufällig, unabhängig und normalverteilt
  • Teststatistik der einfachen Varianzanalyse Aufspaltung in Quadratsumme SSA zwischen Gruppen und eine SSE (auch FehlerSS) innerhalb. Wenn Gruppeneinflüsse groß -> SSA groß. -> je größer SSA, desto eher wird H0 abgelehnt. MS = Quotient der ...
  • Zweifache Varianzanalyse ohne Wechselwirkungen Zwefache VA ohne Wechselwirkungen yijk = mü + ai + bj + eijk mit eijk unabhängig und nverteilt. Nullhypothesen: HA a = a2 = … = 0, HB b1 = b2 = … = 0. Wenn HA zutrifft, sind SSA und SSE unabhängig, ...
  • Zweifache VA mit Wechselwirkungen yijk = mü + ai + bj + (ab)ij + eijk wobei die Summe von (ab)i = 0 und die Summe von (ab)j = 0. Wichtig: man braucht pro Zelle mehrere Beobachtungen! Für HA und HB und HAB gilt: wenn HAB zutrifft, sind ...
  • Varianztests: Bartletttest: normalverteilte Stichproben!! Stichprobenumfang nicht zu klein -> mindestens 5 n. Testgröße b ist X2 verteilt mit f Freiheitsgraden. Große Werte für b sprechen gegen H0. Hartley-Test: ...
  • Regressions- und Korrelationsanalyse -> Test der ... Korrelationskoeffizient: -1 <= rxy <= 1 Liegt er bei 0 -> kein linearer Zusammenhang; bei |1| -> vollkommener linearer Zusammenhang. Vorzeichen gibt Richtung an, also ob mit steigenden Werten von X (unabhängig) ...
  • Regressionskoeffizienten Zwei kontinuierliche Größen x und y -> y = a + bx + E E = Fehler, bei zB Fahrgeschwindigkeit usw wo es Abweichungen geben kann; E = a + bxFehler E muss N(0, s2) normalverteilt sein, s2 muss von x ...
  • Regressionskoeffizientenschätzung Unabhängige Stichproben X und Y Beste Regression ist die, bei der die Summe von a und b minimal ist und die minimalen Abstand zu allen Punkten hat -> minimale Fehler/Residuen bezeichnet (Fehler = y – ...
  • Regressionskoeffizientenschätzung Regressionskoeffizienten sind unbekannt, deshalb müssen sie geschätzt werden! Unabhängige Stichproben X und Y Beste Regression ist die, bei der die Summe von a und b minimal ist und die minimalen Abstand ...
  • Fehlervarianz/Modellvarianz: durchschnittliche Abweichung der Messwerte von der Regressionsgerade -> Residuen müssen unabhängig, identisch verteilt und im Mittel 0 sein
  • Bestimmtheitsmaß R2 Regressionsmodellen (nicht in beliebigen Modellen!) ist R2 = rxy zum Quadrat. Gibt linearen Zusammenhang der x und y Werte wieder -> geringes R2 heißt kein linearer Zusammenhang! (aber nicht automatisch, ...
  • Konfidenz- und Prognoseband: Schätzung für gewisse Werte ist normalverteilt. Variabilität der Schätzung hängt von der Unsicherheit der Regressionsgeraden (also der Varianz von a und b) ab.
  • Nicht parametrische Verfahren: Rangtests 1. Rangtests: Es geht nicht um die Testgröße sondern um die Position des Wertes in der Stichprobe. Keine Verteilungsannahmen werden getroffen, aber Voraussetzung sind kontinuierliche Merkmale. Achtung: ...
  • Nichtparametrische Verfahren: Vorzeichentests Speziallfall des Binominaltests (Test über Anteilsparameter) und überprüft Hypothesen, dass positive und negative Werte eines Merkmals X wahrscheinlich sind. Großer Vorteil: Verteilungsannahmen spielen ...
  • Nichtparametrische Verfahren: Tests auf Verteilung X2-Test: Anpassungstest -> einfachster und naheliegenster Test zur Beurteilung von Modellen (wie Wahrscheinlichkeitsverteilungen). 2 Annahmen: Die Zufallsgröße X besitzt die Wahrscheinlichkeitsverteilung-Px; ...
  • Konfidenztabellen Es werden DISKRETE Variablen analysiert (nach Unabhängigkeit) Kreuztabellen: einfachster Fall, Merkmalsbereich sind natürliche Zahlen, r*c mögliche Kombinationen des multidimensionalen Merkmals (X1,X2) ...