見出し画像

統計学実践ワークブック 第6章例題解説

例題

問6.1

公式テキストの分かりにくいポイント
第6章で何も解説していないにもかかわらず、例題で偏差値や四分位範囲を求める問題が出てくる。

(1)偏差値=(個人の得点-平均点)÷標準偏差×10+50であるので、偏差値はそれぞれ

$$
A君の偏差値:(85-65)÷10×10+50=70\\
B君の偏差値:(60-65)÷10×10+50=45
$$

(2)正規分布の累積分布表を用いて面積を求め、おおよその人数を計算する。
A君、B君の点数を標準化するとそれぞれ$${\frac{85-65}{10}=2,\frac{60-65}{10}=-0.5}$$であるので

$$
1000×\int_{-0.5}^{2}f(z)dz=1000×(1-0.0228-0.3085)=668.7
$$

よって、A君とB君の得点の間に入る受験者の人数はおよそ669人。

(3)標準正規分布の四分位範囲は巻末の表より

$$
0.32<Q1<0.33\\
0.67<Q3<0.68
$$

正規分布$${N(65,10^2)}$$における四分位を$${X1,X2}$$とすると、それぞれを標準化することによって$${Q1,Q3}$$が得られるので

$$
\frac{X1-65}{10}=Q1\\
-0.68<\frac{X1-65}{10}<-0.67\\
58.2<X1<58.3\\
\frac{X2-65}{10}=Q2\\
0.67<\frac{X2-65}{10}<0.68\\
71.7<X2<71.8\\
13.4<X2-X1<13.6
$$

よって四分位範囲の長さは約14点。

(4)標準化の考え方から$${E[X|X≧65]=65+10E[Z|Z≧0]}$$と置くことができる。

$$
f(z|z≧0)=\frac{f(z)}{P(Z≧0)}=2f(z)=\sqrt \frac{2}{π}exp(-\frac{z^2}{2})\\
E[Z|Z≧0]=\int_{∞}^{0}zf(z)dz\\
=\int_{∞}^{0}z\sqrt \frac{2}{π}exp(-\frac{z^2}{2})dz\\
=[-\sqrt \frac{2}{π}exp(-\frac{z^2}{2})]_{0}^{∞}\\
=\sqrt \frac{2}{π}\\
E[X|X≧65]=65+10E[Z|Z≧0]=65+10\sqrt \frac{2}{π}=72.978
$$

よって、おおよそ73点となる。

問6.2

(1)2変数の分散の公式より

$$
V[X+Y]=V[X]+V[Y]+2Cov(X,Y)\\
Cov(X,Y)=\frac{V[X+Y]-V[X]-V[Y]}{2}=\frac{150^2-80^2-90^2}{2}=4000\\
$$

ListeningとReadingの相関係数$${R}$$は

$$
R=\frac{Cov(X,Y)}{\sqrt{V[X]}{\sqrt{V[Y]}}}=\frac{4000}{80・90}≒0.56
$$

(2)2変量正規分布の公式より

$$
E[X_2|X_1=x_1]=μ_2+ρ・\frac{σ_2}{σ_1}(x_1-μ_1)=μ_2+\frac{σ_{12}}{σ_1^2}(x_1-μ_1)
$$

$${X_1}$$をListening、$${X_2}$$をReadingとすると、$${μ_1=305,μ_2=250,σ_1=80,σ_2=90,σ_{12}=Cov(X_1,X_2)=4000}$$であるので

$$
E[X_2|X_1=335]=μ_2+\frac{σ_{12}}{σ_1^2}(x_1-μ_1)\\
=250+\frac{4000}{80^2}(335-305)\\
=268.765≒269
$$

問6.3

公式テキストの分かりにくいポイント
生存関数とは何か解説が一切ないまま問題が出題されている。せめて「生存関数とは被験者がある期間$${t}$$よりも長く生きる確率です」くらいは書いてほしい。

(1)累積分布関数を$${F(t)}$$とすると、$${f(t)}$$は$${F(t)}$$を微分することによって求められる。また$${F(t)}$$は時間$${t}$$よりも長く生存しない確率の累積、つまり$${F(t)=P(T≦t)}$$とおける。

$$
F(t)=P(T≦t)=1-P(T>t)=1-exp(-λt)\\
f(t)=\frac{dF(t)}{dt}\\
=\frac{d}{dt}(1-exp(-λt))\\
=λexp(-λt)     (t≧0)
$$

(2)$${t≧0}$$のもと$${f(t)}$$の期待値は下記のように表せる。

$$
E(t)=\int_{0}^{∞}tf(t)dt\\
=\int_{0}^{∞}λt・exp(-λt)dt\\
$$

ここで積分の公式$${\int{f'(x)g(x)}dx=f(x)g(x)-\int{f(x)g'(x)dx}}$$を用いて$${f'(t)=exp(-λt),g(t)=λt}$$とすると

$$
E(t)=\int_{0}^{∞}λt・exp(-λt)dt\\
=\int_{0}^{∞}f'(t)g(t)dt\\
=[f(t)g(t)]_{0}^{∞}-\int_{0}^{∞}f(t)g'(t)dt\\
=[-\frac{1}{λ}exp(-λt)・λt]_{0}^{∞}-\int_{0}^{∞}(-\frac{1}{λ}exp(-λt))・λdt\\
=[-texp(-λt)]_{0}^{∞}+\int_{0}^{∞}exp(-λt)dt\\
=0+[-\frac{1}{λ}exp(-λt)]_{0}^{∞}\\
=\frac{1}{λ}
$$

このとき、$${[-texp(-λt)]_{0}^{∞}=0}$$は指数関数の定理$${\displaystyle \lim_{n \to \infty} xe^{-x}=0}$$を利用している。

また上側25%点は、累積分布関数$${F(t)=\frac{3}{4}}$$となる点であるため

$$
F(t)=1-S(t)=1-exp(-λt)=\frac{3}{4}\\
exp(-λt)=\frac{1}{4}\\
-λt=log\frac{1}{4}=-log4\\
t=\frac{log4}{λ}
$$

よって平均は$${\frac{1}{λ}}$$、上側25%点は$${\frac{log4}{λ}}$$

(3)標本平均が3.0年であることから

$$
E(t)=\frac{1}{λ}=3\\
λ=\frac{1}{3}
$$

Tの上側25%値は(2)の結果より

$$
\frac{log4}{λ}=3log4≒4.2
$$

問6.4

(1)得点xに対する偏差値は$${\frac{x-μ}{σ}×10+50}$$で表せるので
Aさんの偏差値は

$$
\frac{67-65}{4}×10+50=55
$$

Bさんの偏差値は

$$
\frac{82-85}{3}×10+50=40
$$

(2)文系の累積分布関数は$${Φ(\frac{x-65}{4})}$$
60点未満のときの累積分布関数の下側確率は、正規分布の表より

$$
Φ(\frac{60-65}{4})=Φ(\frac{-5}{4})=Φ(-1.25)=0.1056
$$

人数に換算すると$${300×0.1056=31.68}$$

理系の累積分布関数は$${Φ(\frac{x-85}{3})}$$

60点未満のとき

$$
Φ(\frac{60-85}{3})=Φ(\frac{-25}{3})=Φ(-8.333)=0.000
$$

よって文系・理系の計500人のうち31.68人が不合格となるので、合格率は

$$
\frac{500-31.68}{500}×100=93.6≒94%
$$


この記事が気に入ったらサポートをしてみませんか?