Statistik – Einführung Stichprobenverteilung Kapitel 6 Statistik – WU Wien Gerhard Derflinger Michael Hauser Jörg Lenneis Josef Leydold Günter Tirler Rosmarie Wakolbinger dasud@statistik.wu-wien.ac.at – (2003) Statistik – Einführung // Stichprobenverteilung – 6 – p.0/26 Lernziele 1. Beschreiben Eigenschaften von Schätzern. 2. Beschreiben Stichprobenverteilungen. 3. Beschreiben den Zusammenhang zwischen Grundgesamtheit und Stichprobenverteilung. 4. Formulieren den zentralen Grenzwertsatz. dasud@statistik.wu-wien.ac.at – (2003) Statistik – Einführung // Stichprobenverteilung – 6 – p.1/26 Statistische Methoden Statistische Methoden Beschreibende Schließende Statistik Statistik dasud@statistik.wu-wien.ac.at – (2003) Statistik – Einführung // Stichprobenverteilung – 6 – p.2/26 Umfasst Schätzen Hypothesen testen Zweck mittels einer Stichprobe auf eine Grundgesamtheit schließen. Beispiel: 100 Telefoninterviews nach einer TV-Diskussion: Wer hat besser abgeschnitten, Kandidat A oder Kandidat B? Angenommen Kandidat A wird von 60% der Befragten bevorzugt. Gilt dies auch für die 2 Mio. Seher? dasud@statistik.wu-wien.ac.at – (2003) Statistik – Einführung // Stichprobenverteilung – 6 – p.3/26 Statistisches Schließen Schätzwerte & Tests Stichprobenstatistik ( X̄) dasud@statistik.wu-wien.ac.at – (2003) Grundgesamtheit (µ ) Stichprobe Statistik – Einführung // Stichprobenverteilung – 6 – p.4/26 Schätzer Zufallsvariable werden benutzt um Parameter der Grundgesamtheit zu schätzen. Stichprobenmittelwert, Stichprobenanteil, Stichprobenvarianz sind Zufallsvariable. Beispiel: Stichprobenmittelwert X̄ ist Schätzer für den Erwartungswert µ der Grundgesamtheit. Ist X̄ Ist X̄ 3, so ist 3 ein (Punkt-)Schätzer für µ . 4, so ist 4 ein Schätzer für µ . Die theoretische Basis für die Eigenschaften unserer Schätzer bildet die zugehörige Stichprobenverteilung. dasud@statistik.wu-wien.ac.at – (2003) Statistik – Einführung // Stichprobenverteilung – 6 – p.5/26 Die Stichprobenverteilung ist eine theoretische Verteilung. Die Stichprobenstatistik ist eine Zufallsvariable. Ihr Wert hängt von der jeweils gezogenen Stichprobe ab. Z.B.: Stichprobenmittelwert, Stichprobenanteilswert, . . . Die Stichprobenverteilung erhält man durch Ziehen aller möglichen Stichproben fixer Größe. Für jede mögliche Stichprobe berechnet man z.B. das Stichprobenmittel. Die Stichprobenverteilung ist die Liste x̄, f x̄ x̄ für z.B. das Stichprobenmittel. dasud@statistik.wu-wien.ac.at – (2003) Statistik – Einführung // Stichprobenverteilung – 6 – p.6/26 Bestimmung der Stichprobenverteilung Beispiel: Urne mit 4 Kugeln mit Gewinnzahlen 1 bis 4. Ziehen mit Zurücklegen. Zufallsvariable X, 1-maliges Ziehen, ist diskret gleich verteilt. Werte für X: x P X 1 1, 2, 3, 4 ... P X 4 1 4 dasud@statistik.wu-wien.ac.at – (2003) Statistik – Einführung // Stichprobenverteilung – 6 – p.7/26 Bestimmung der Stichprobenverteilung Parameter der Grundgesamtheit: N 1 ∑ xi N µ i 1 1 2 3 4 4 2.5 σ N ∑ i 1 1 xi µ 2 N 0 1 2 3 4 1.12 dasud@statistik.wu-wien.ac.at – (2003) Statistik – Einführung // Stichprobenverteilung – 6 – p.8/26 16 Stichprobenmuster 16 Stichprobenmittelwerte 2. Beobachtung 1 2 3 4 1 1/1 1/2 1/3 1/4 2 2/1 2/2 2/3 2/4 3 3/1 3/2 3/3 3/4 4 4/1 4/2 4/3 4/4 1. Beobachtung 1. Beobachtung 2. Beobachtung 1 2 3 4 1 1.0 1.5 2.0 2.5 2 1.5 2.0 2.5 3.0 3 2.0 2.5 3.0 3.5 4 2.5 3.0 3.5 4.0 Ziehen mit Zurücklegen dasud@statistik.wu-wien.ac.at – (2003) Statistik – Einführung // Stichprobenverteilung – 6 – p.9/26 Verteilung aller Stichprobenmittelwerte 16 Stichprobenmittelwerte 1. Beobachtung 2. Beobachtung 1 2 3 4 1 1.0 1.5 2.0 2.5 2 1.5 2.0 2.5 3.0 3 2.0 2.5 3.0 3.5 4 2.5 3.0 3.5 4.0 0 dasud@statistik.wu-wien.ac.at – (2003) 1 2 3 4 Statistik – Einführung // Stichprobenverteilung – 6 – p.10/26 Parameter Stichprobenverteilung ∑iN 1 x̄i N 2.5 µ x̄ 1.0 1.5 1.5 2.0 . . . 4.0 16 ∑iN 1 x̄i µ x̄ N 1.0 2.5 2 σ x̄2 2 1.5 2.5 2 1.5 2.5 16 2 ... 4.0 2.5 2 0.792 dasud@statistik.wu-wien.ac.at – (2003) Statistik – Einführung // Stichprobenverteilung – 6 – p.11/26 Grundgesamtheit 0 1 2 µ 3 σ 4 Stichprobe 0 1 2 2.5 µ x̄ 1.12 σ x̄ dasud@statistik.wu-wien.ac.at – (2003) 3 4 2.5 0.79 Statistik – Einführung // Stichprobenverteilung – 6 – p.12/26 Standardfehler des Mittelwertes Ist die Standardabweichung aller möglichen Stichprobenmittelwerte X̄. Misst die Streuung unter allen möglichen (verschiedenen) Stichprobenmittelwerten. Kleiner als Standardabweichung der Grundgesamtheit (außer n 1). Formel (für Ziehen mit Zurücklegen): σ x̄ dasud@statistik.wu-wien.ac.at – (2003) σ n Statistik – Einführung // Stichprobenverteilung – 6 – p.13/26 Eigenschaften der Stichprobenverteilung dasud@statistik.wu-wien.ac.at – (2003) Statistik – Einführung // Stichprobenverteilung – 6 – p.14/26 Unverzerrtheit Der Mittelwert der Stichprobenverteilung ist gleich dem Mittelwert der Grundgesamtheit (Erwartungswert). Effizienz Der Mittelwert der Stichprobenverteilung ist näher am Mittelwert der Grundgesamtheit als irgendein anderer unverzerrter Schätzer. Konsistenz Bei steigender Stichprobengröße wird die Abweichung des Stichprobenmittelwertes vom Mittelwert der Grundgesamtheit kleiner und geht mit n gegen unendlich gegen Null. dasud@statistik.wu-wien.ac.at – (2003) Statistik – Einführung // Stichprobenverteilung – 6 – p.15/26 Unverzerrtheit unverzerrt verzerrt µ µ x̄ x µ x̃ Vergleich zweier Schätzer für µ : x̄ und x̃. dasud@statistik.wu-wien.ac.at – (2003) Statistik – Einführung // Stichprobenverteilung – 6 – p.16/26 Effizienz (Vergleich bei festem n) Stichprobenverteilung des Mittels Stichprobenverteilung des Medians µ dasud@statistik.wu-wien.ac.at – (2003) x Statistik – Einführung // Stichprobenverteilung – 6 – p.17/26 f x̄ größere Stichprobe kleinere Stichprobe µ x̄ µ x̄ dasud@statistik.wu-wien.ac.at – (2003) Statistik – Einführung // Stichprobenverteilung – 6 – p.18/26 Normalverteilte Grundgesamtheit Grundgesamtheit Mittelwert: µ x̄ µ σ Standardabweichung: σ σ x̄ n µ 10 x 50 Stichprobe n 16, σ x̄ (Ziehen mit Zurücklegen, bzw. sehr große Grundgesamtheit) n µ x̄ dasud@statistik.wu-wien.ac.at – (2003) 2.5 4, σ x̄ 5 x̄ 50 Statistik – Einführung // Stichprobenverteilung – 6 – p.19/26 Standardisieren der Stichprobenverteilung Z f x̄ X̄ µ x̄ σ x̄ X̄ µ f z Stichprobenverteilung σ n Standardisierte Stichprobenverteilung σ x̄ µ x̄ dasud@statistik.wu-wien.ac.at – (2003) σ x̄ µ 0 1 z Statistik – Einführung // Stichprobenverteilung – 6 – p.20/26 Ferngespräche, die von einer Telefongesellschaft abgewickelt werden, seien normalverteilt mit µ 8 min und σ 2 min. Wie groß ist die Wahrscheinlichkeit, dass die durchschnittliche Gesprächsdauer von 25 zufällig ausgewählten Telefonaten zwischen 7.8 und 8.2 Minuten liegt? dasud@statistik.wu-wien.ac.at – (2003) Statistik – Einführung // Stichprobenverteilung – 6 – p.21/26 Stichprobenverteilung // Lösung z2 x̄2 µ σ n 8.2 8 2 25 0.5 0.5 Standardisierte Stichprobenverteilung Stichprobenverteilung σ x̄ 7.8 8 2 25 x̄1 µ σ n z1 0.4 σ 1 0.3830 0.1915 0.1915 7.8 µ x̄ 8 8.2 x̄ dasud@statistik.wu-wien.ac.at – (2003) 0.5 µ 0 z 0.5 Statistik – Einführung // Stichprobenverteilung – 6 – p.22/26 Nicht-Normalverteilte Grundgesamtheit Grundgesamtheit Mittelwert: µ x̄ µ Standardabweichung: σ σ x̄ n σ µ 10 x 50 Stichprobe n (Ziehen mit Zurücklegen, bzw. sehr große Grundgesamtheit) n µ x̄ dasud@statistik.wu-wien.ac.at – (2003) 30, σ x̄ 50 1.8 4, σ x̄ 5 x̄ Statistik – Einführung // Stichprobenverteilung – 6 – p.23/26 Zentraler Grenzwertsatz dasud@statistik.wu-wien.ac.at – (2003) Statistik – Einführung // Stichprobenverteilung – 6 – p.24/26 Zentraler Grenzwertsatz Bei hinreichend großer Stichprobengröße (n 30) wird Stichprobenverteilung annäherend normalverteilt mit σ x̄ dasud@statistik.wu-wien.ac.at – (2003) σ . n Statistik – Einführung // Stichprobenverteilung – 6 – p.25/26 Zusammenfassung 1. Beschrieben Eigenschaften von Schätzern. 2. Beschrieben Stichprobenverteilungen. 3. Beschrieben Zusammenhang zwischen Grundgesamtheit und Stichprobenverteilung. 4. Formulierten zentralen Grenzwertsatz. dasud@statistik.wu-wien.ac.at – (2003) Statistik – Einführung // Stichprobenverteilung – 6 – p.26/26