Mathematik (Subject) / Statistik, Kombinatorik und Wahrscheinlichkeitsrechnung (Lesson)

There are 176 cards in this lesson

Variation,Permutation etc.

This lesson was created by JamesCohn.

Learn lesson

  • Verteilungsparameter stetiger Zufallsvariablen Verteilungsparameter sind Größen, die bestimmte Aspekte einer Verteilung charakterisieren, wie zum Beispiel Lage, Streuung oder Schiefe einer Verteilung. Wichtige Parameter sind:(Standardabweichung) tandardabweichung (Streuungsparameter): Die Standardabweichung ist die positive Wurzel aus der Varianz und gibt die Streuung der Werte um den Mittelwert an. Damit ist die Standardabweichung ebenfalls ein Maß für die Streuung, nur dass sie etwas langsamer ansteigt als die Varianz. Kennt man die Varianz, dann kann diese leicht in die Standardabweichung umgerechnet werden (und umgekehrt). σ=√V(X)=√σ2
  • Normalverteilung Die Normal- oder Gauß-Verteilung (oder Glockenkurve) ist die wichtigste stetige Verteilung. X heißt normalverteilt oder Gauß-verteilt mit den Parametern μ∈ℝ und σ2>0, kurz X∼N(μ,σ2), wenn X folgende Dichte hat f(x)=    1 /σ⋅√2π       ⋅e−1/2⋅(x−μ/σ)^2, ∀x∈ℝ Gucken wir uns kurz die Formel genau an. 1/σ⋅√2π : Der Vorfaktor normiert alle Funktionswerte, so dass diese zwischen 0 und 1 liegen. e−12⋅(x−μσ)2: Dieser Faktor gibt die Häufigkeit von x an. Verteilungsparameter: Erwartungswert: E(x)=μ, beschreibt x mit der größten Häufigkeit (Hochpunkt der Glocke) Varianz: V(x)=σ2 Standardabweichung: σ, gibt Breite der Kurve an
  • Standardisieren von normalverteilten Zufallsvariablen Die Verteilungsfunktion der Normalverteilung kann man nicht mit einer Formel im Taschenrechner berechnen. Das Integral über der Dichtefunktion lässt sich nämlich nicht mit Stift und Papier lösen: F(x)=   1/σ⋅√2π      ∫x−∞e−1/2⋅(t−μ/σ)2 dt, ∀x∈ℝ Wir nehmen dafür eine Verteilungstabelle mit der man Werte F(x) der Verteilungsfunktion jeder beliebigen Normalverteilung bestimmen kann. Allerdings gibt es unendlich viele Normalverteilungen, sodass wir ausschließlich eine Tabelle für Standardnormalverteilungen X∼N(0,1) mit μ=0 und σ2=1 verwenden. Wir müssen also die normalverteilten Zufallsvariablen standardisieren und dann deren Wert anhand der Verteilungstabelle bestimmen! Es gilt: P(X≤x)=P(Z≤ x−μ/σ)= "phi"( x−μ / σ)="phi"(z) mit der standardisierten Zufallsvariable             Z= X−μ / σ. Die Standardnormalverteilung wird dabei statt F(x) mit "phi"(z) notiert, um Verwechslungen mit der unstandardisierten Verteilungsfunktion zu vermeiden.
  • Gleich lange Intervalle mit ungleichen Flächeninhalten (=Wahrscheinlichkeiten) Auch bei der Standard-Normalverteilung besitzen gleich lange Intervalle fast immer eine unterschiedliche Wahrscheinlichkeit.
  • Sei a ∈ R. Dann definieren wir den Wert pφ (]a;b]) pφ (]a;b]) = ∫a-∞ φ(t) dt Kurzschreibweise: pφ(≤a)
  • Auch wenn die obere Intervallgranze fehlt, bereitet uns die Definition des pφ-Wertes keine Probleme. Wir definieren einfach: pφ  (]a;b[) = pφ (]-∞;a]) Kurzschreibweise:  pφ (<a)
  • Sei b ∈ R. Dann definieren wir den Wert pφ ([b;∞[) folgendermaßen: pφ ([b;∞[)= ∫∞b φ (t) dt Kurzschreibweise: pφ (≥b) Auch wenn die untere Intervallgrenze fehlt, bereitet uns die Definition des pφ-Wertes keine Probleme. Wir definieren einfach: pφ (]b;∞[)  = pφ ([a;b[), Kurzschreibweise: pφ(>b)
  • Auch im Falle der Standard-Normalverteilung legen wir die Verteilungsfunktion so fest, dass sie für jede reelle Zahl x die Wahrscheinlichkeit eines Zufallsergebnisses ≤x ergibt. Diese spezielle Verteilungsfunktion wird in der Literatur häufig als Φ bezeichnet. Die formale Definition für Φ lautet also folgendermaßen: Φ(x) = pφ(]-∞;x]) Das bedeutet zugleich: Φ(x) = ∫x-∞ φ (t)dt   und  Φ(x) = pφ (≤x) Gleichheit von Φ(x) und pφ(]-∞;x])
  • Anwendung der Φ-Tabelle-> können Sie stattdessen aber durchaus auch mit EXCEL arbeiten: Wenn Sie φ(x) berechnen wolle, so geben sie bitte NORMVERT (x ; 0 ; 1; 0) ein Wenn Sie Φ(x) berechnen wollen, so geben Sie bitte NORMVERT (x; 0; 1; 1) ein. Beispiel: Angenommen, Sie wollen  Φ(0,5) ermitteln. Dann geben Sie NORMVERT (0,5; 0; 1; 1) ein, und es erscheint das Ergebnis 0,6915  Wenn Sie zu einem gegebenen Φ-Wert= p0 berechnen wollen, so geben Sie bitte NORMINV(p0; 0; 1) ein Z.B. Angenommen, Sie wollen zu dem Φ-Wert p0=0,1 dasjenige x ermitteln, für das gilt: p0=0,1= Φ(x). Dass geben Sie NORMINV(0,1; 0; 1) ein und es erscheint das Ergebnis -1,28
  • Auch im Falle der Standard-Normalverteilung ergibt sich die Wahrscheinlichkeitverteilung unmittelbar aus der Verteilungsfunktion: p φ ([a;b]) = Φ(b) - Φ(a) für alle a≤b
  • Φ' = Φ' = φ
  • Eine standard-normalverteilte Zufallsvariable X ist eine Funktion, deren Funktionswerte X(e) sich so verhalten, als käme sie unmittelbar von einem Zufallsgenerator mit einer Standard-Normalverteilung. Das bedeutet insbesondere, dass für alle a,b∈R mit a<b gilt: p(a≤X≤b) = p φ ([a;b]) = ∫ba φ(t) dt Generell muss für jedes Intervall I gelten: p(X∈I) = pφ (I) Über den Erwartungswert sowie die Varianz und die Stanardabweichung einer standard-normalverteilten Zufallsgröße gibt es ein einfaches Resultat; der Beweis ist nicht übermäßig komplinziert, wir lassen ihn jedoch weg.
  • Sei X eine normiert normalverteilte Zufallsvariable. Dann hat X den Erwartungswert E(x)=0 außerdem die Varianz σ^2=Var(X)=1 und die Standardabweichung σ = √Var(X) =s(X)=1
  • Für alle x gilt: Φ(-x) = 1 - Φ(x)
  • Als nächstes definieren wir die symmetrische Variante der Verteilungsfunktion Φ. Diese Funktion gibt an, mit welcher Wahrscheinlichkeit eine Zufallszahl e höchstens um x Einheiten von 0 abweciht Wir bezeichnen die folgende Funktion Φsymm als die symmetrische Variante der Verteilungsfunktion Φ: Φsymm (x) = ∫x-x φ (t) dt = Φ(x) - Φ(-x) für alle x≥0 (=pφ (-x≤X≤x), falls X eine standard-normalverteilte Zufallsvariable ist.
  • Sei x≥0. Dann ist Φsymm(x) = pφ ([-x;x]) Wenn außerdem X eine normalverteile Zufallsgröße ist, so gilt: Φsymm(x) =pφ(-x≤X≤x) = pφ (I X I ≤ x)
  • Für alle x ≥ 0 ist Φsymm(x) = 2 . Φ(x) -1
  • Quantile Quantile oder genauer gesagt α-Quantile sind Werte, die eine Menge an Daten in zwei Teile spalten. Ein Anteil dieser Daten ist mindestens α kleiner oder gleich dem α-Quantil und mindestens ein Anteil ist 1−α größer oder gleich dem α-Quantil. Ein 0,3-Quantil ist dasselbe wie ein 30%-Quantil und bedeutet, dass die Daten in die niedrigen 30% und die hohen 70% aufgeteilt werden. Übrigens: Der Median ist nichts anderes als das 50%-Quantil.
  • Quantile bestimmen Das α-Quantil einer Normalverteilung bestimmt man genau umgekehrt wie den Wert der Verteilungsfunktion. Wir schlagen zuerst das α-Quantil der Standardnormalverteilung in der Verteilungstabelle nach. Nennen wir es zα. Anschließend transformieren wir es in das Quantil qα der tatsächlichen Normalverteilung, indem wir es erst mit σ multiplizieren und dann noch μ addieren. Es gilt: qα=μ+σ⋅zα
  • Bestimme das i) 50%-Quantil q0,5 und es sei X∼N(−1;4): q0,5=μ+σ⋅z0,5=−1+√4 ⋅0=−1 Merke: Das 50\%-Quantil jeder Normalverteilung ist immer μ.
  • bestimme das 97,5%-Quantil q0,975 und es sei X∼N(0;5): q0,975=μ+σ⋅z0,975=0+√5 ⋅1,96=4,382
  • Approximation der Binomialverteilung durch die Normalverteilung + Bedingung Bei der praktischen Anwendung der Binomialverteilung kann es vorkommen, das sehr große Werte von n, z.B. n=10000 auftreten, wodurch das Berechnen der Wahrscheinlichkeiten sehr zeitaufwendig wird. Wir haben dann die Möglichkeit, die Binomialverteilung durch die Normalverteilung anzunähern (approximieren).Die Annäherung geht aber nur, wenn eine der beiden folgenden Bedingungen erfüllt ist: Laplace-Bedingung σ= √n⋅p⋅(1−p) >3 oder n⋅p  >4 und n⋅(1−p)  >4 Warum hilft uns das überhaupt? Bei der Binomialverteilung können nur ganze Zahlen über Null eingesetzt werden. Durch die Ersetzung durch die Normalverteilung können für x nun alle Werte, egal ob Komma-Zahlen oder negative Zahlen eingesetzt werden. Wenn eine der beiden Bedingungen erfüllt ist, gilt: P(X≤x)=Φ(x−np / √np(1−p))=Φ(x−μ/σ)
  • Bei der Approximation einer diskreten Verteilungsfunktion durch eine stetige, muss noch eine Stetigkeitskorrektur vorgenommen werden. Man erhält: P(X≤x)≈Φ  ( x+0,5-np / √np(1-p) ) P(X≥x)≈ 1-Φ ( x -0,5-np / √np(1-p)) P(a<X≤b)≈                                                   Φ(b+0,5-np /√np(1-p)) - Φ(a-0,5-np/√np(1-p) ) Merke: Es wird hier eine diskrete Verteilung durch eine stetige Verteilung approximiert, deswegen muss eine Stetigkeitskorrektur durchgeführt werden, die je nach Aufgabenstellung ± 0,5 beträgt.
  • Beispiel: Ein Drittel aller Ehepaare sind im Mittel kinderlos. X sei die Anzahl der kinderlosen Paare unter 120 zufällig ausgewählten. Grundlegend handelt es sich hierbei um eine Binomialverteilung mit den Parametern n=120 und p=1/3. Mit welcher Wahrscheinlichkeit befinden sich darunter 1. nicht mehr als 48 kinderlose Paare? 2. mehr als 30 aber höchstens 50 kinderlose Ehepaare? 1. nicht mehr als 48 kinderlose Paare? Aus der Fragestellung geht hervor, dass die Berechnung der Einzeltreffer sehr lange dauern würde. Zudem sollte erkannt werden, dass die Laplace-Bedingung mit σ≈5,16>3 erfüllt ist. Dadurch ist eine Approximation von der Binomialverteilung durch die Normalverteilung möglich. X∼B(n,p)≈N(μ,σ2) Zur Berechnung der Normalverteilung ist es allerdings notwendig die Parameter μ und σ2 zu kennen.Erwartungswert: μ=E(X)=n⋅p=120⋅1/3=40Varianz: σ2=V(X)=n⋅p⋅(1−p)=120⋅1/3⋅(1−1/3)=26,67 Dann folgt:P(X≤48)≈Φ(48+0,5−40/√26,67)=Φ(1,65)=0,9505 Die Wahrscheinlichkeit beträgt ungefähr 95,05 %. 2. mehr als 30 aber höchstens 50 kinderlose Ehepaare? In dieser Aufgabenstellung wird ersichtlich, dass es sich um ein Intervall handelt. Wie wir schon festgestellt haben, können wir die Binomialverteilung durch die Normalverteilung approximieren: X∼B(n,p)≈N(μ,σ2) Den Erwartungswert und die Varianz haben wir bereits ermittelt. Dann folgt: P(30<X≤50)≈  Φ(50+0,5−40/√26,67)−Φ(30−0,5−40/√26,67)=Φ(2,03)−Φ(−2,03)= Φ(2,03)−(1−Φ(2,03))=2⋅Φ(2,03)1 =2⋅0,9788–1=0,9576 Die Wahrscheinlichkeit, dass mehr als 30 aber höchstens 50 kinderlose Ehepaare unter allen Ehepaaren befinden beträgt ungefähr 95,76 %.
  • Wahrscheinlichkeiten für Intervalle Es sei X∼N(μ,σ^2) und a, b∈ℝ, a≤b, dann gilt: P(a≤X≤b)= Φ(b−μ / σ) – Φ(a−μ / σ) P(X≤b)= Φ (b−μ / σ) P(X>a)=1 − Φ (a−μ / σ)
  • Wichtig: Wegen Symmetrie der Dichtefunktion gilt Φ(−z)=?. Falls also in der Klammer von Φ eine negative Zahl rauskommt, könnt ihr diese so umschreiben. Wichtig: Wegen Symmetrie der Dichtefunktion gilt Φ(−z)=1−Φ(z). Falls also in der Klammer von Φ eine negative Zahl rauskommt, könnt ihr diese so umschreiben.