Hochschule RheinMain
Prof. Dr. D. Lehmann
WS 2016/17
8. Übungsblatt zur Vorlesung Ökonometrie
Aufgabe 1 (t-Verteilung): Die t-Verteilung lässt sich auch folgendermassen motivieren:
(i) Es sei X1 , X2 , ..., Xn eine Folge von unabhängigen, identisch verteilten Zufallsvariablen
mit Erwartungswert µ = E[Xi ] und Varianz σ 2 = V[Xi ] für alle i = 1, 2, ..., n. Nach dem
zentralen Grenzwertsatz der Wahrscheinlichkeitstheorie konvergiert dann die Verteilung
der Zufallsvariable
1 Pn
Pn
1
X
−
E
X
i
i
i=1
n
Yn := n ni=1
o1/2
P
n
V n1 i=1 Xi
Pn
1
i=1 Xi − µ
n
√
=
σ/ n
gegen eine Standard-Normalverteilung.
(ii) Es seien jetzt φ1 , φ2 , ..., φn eine Folge von unabhängigen, identisch normalverteilten
Zufallsvariablen mit Erwartungswert µ = E[φi ] und Varianz σ 2 = V[φi ] für alle i =
1, 2, ..., n. Dann ist die Zufallsvariable
Pn
1
i=1 φi − µ
n
√
Yn :=
σ/ n
für jedes n standard-normalverteilt (also nicht erst im Limes für grosse n).
(iii) Bei unbekannter Varianz σ 2 der Zufallszahlen φ1 , φ2 , ..., φn kann man die Varianz
schätzen mit dem Ausdruck
Pn
P
1
2
σ̂ 2 := n−1
wobei φ̄ := n1 ni=1 φi
(1)
i=1 (φi − φ̄)
Nun gilt folgende Aussage A(n) für n ≥ 2 (σ̂ ist für n = 1 nicht definiert): Die Zufallsvariable
Pn
1
i=1 φi − µ
n
√
Yn :=
(2)
σ̂/ n
ist t-verteilt mit n − 1 Freiheitsgraden oder kurz tn−1 -verteilt. Das heisst,
P Yn ∈ (y, y + dy)
= ptn−1 (y) dy
mit der Dichte (jetzt für tn anstatt tn−1 )
ptn (y) =
Γ[(n+1)/2]
√
Γ[n/2] πn
1+
n+1
y2 − 2
n
Dabei ist die Gamma-Funktion gegeben durch (für t > 0)
R∞
Γ(t) = 0 xt−1 e−x dx .
(3)
In dieser Aufgabe wollen wir die Aussage A(n) für einige Werte von n mit einer R-Simulation
überprüfen. Starten Sie dazu eine R-Session und führen Sie folgende Berechnungen durch:
a) Legen Sie die Variablen n = 3, N = 10000 und µ = 15 und σ = 2 an und erzeugen Sie
dann n × N mit Mittelwert µ und Standardabweichung σ normalverteilte Zufallszahlen.
Speichern Sie diese Zufallszahlen in einer Matrix
φ1
φ2
· · · φn
φn+1
φn+2
· · · φ2n
φ2n+1
φ2n+2
· · · φ3n
Phi :=
∈ RN ×n
..
..
..
.
.
.
φ(N −1)n+1 φ(N −1)n+2 · · · φN n
b) Benutzen Sie den Befehl rowSums(), um den Vektor
1
φ̄1
(φ
+
φ
+
·
·
·
+
φ
)
1
2
n
n
1
φ̄2
(φ
n+1 + φn+2 + · · · + φ2n )
n
1
φ̄3
(φ
+
φ
+
·
·
·
+
φ
)
2n+1
2n+2
3n
MeanPhi = :=
∈ RN
n
..
..
.
.
1
φ̄N
(φ(N −1)n+1 + φ(N −1)n+2 + · · · + φN n )
n
zu generieren.
c) Zu gegebenem Datenvektor x = (x1 , · · · , xn ) berechnen die R-Funktionen sd(x) und
var(x) exakt die Grössen σ̂ und σ̂ 2 aus Gleichung (1), also (jeweils n − 1 im Nenner,
kein n)
q
Pn
Pn
1
1
2
2
und var(x) = n−1
sd(x) =
i=1 (xi − x̄)
i=1 (xi − x̄)
n−1
wobei x̄ :=
1
n
Pn
i=1
xi . Überprüfen Sie das für den Vektor x = (1, 3).
d) Machen Sie sich mit dem R-Befehl apply() vertraut. Mit diesem Befehl und der sd()Funktion können Sie auf einfache Weise den Vektor
q
1
n−1
Pn
2
i=1 (φ0+i − φ̄1 )
q
σ̂1
sd(first
row)
P
n
1
σ̂2
sd(second row)
(φ − φ̄2 )2
q n−1 i=1 n+i
P
σ̂3
sd(third row)
n
1
2
SdPhi = :=
=
∈ RN
i=1 (φ2n+i − φ̄3 )
n−1
..
..
.
..
.
.
0
q
σ̂N
sd(N th row)
Pn
1
2
(φ
−
φ̄
)
N
(N
−1)n+i
i=1
n−1
erzeugen, wie geht das genau?
e) Berechnen Sie nun den Vektor (erinnern Sie sich daran, dass R immer elementweise
rechnet, Vektor durch Vektor ist gültige Syntax)
Y
=
MeanPhi − µ
√
SdPhi/ n
f ) Erstellen Sie schliesslich ein Histogramm der Zahlen Y = (y1 , y1 , · · · , yN ) und plotten
Sie in dasselbe Diagramm die entsprechende Dichte der t-Verteilung. Histogramm und
Dichte sollten dann also im Wesentlichen übereinstimmen:
g) Produzieren Sie das Bild aus Teil (f) für alle Werte von n ∈ {2, 3, ..., 10}.
Bemerkung: Insbesondere die Verteilungen t1 = t2−1 und t2 = t3−1 können mitunter sehr grosse, sowohl positive als auch negative, Zahlen produzieren mit spürbarer
Wahrscheinlichkeit. Man muss mit den Parametern des hist()-Befehls etwas herumexperimentieren, mal in die Hilfe schauen, damit man auch für n = 2 und n = 3 ein
schönes Histogramm bekommt:
Im Limes n → ∞ konvergiert die t-Verteilung gegen eine Standard-Normalverteilung.