母平均の区間推定(母分散が未知&大標本の場合)

Pocket

標本数が30以上(大標本)の場合の母平均の区間推定の方法を説明します。標本数が30以上(大標本)の場合、標本平均と標本分散(または標本標準偏差)のみからから母平均を推定することができます。母集団の真の平均は求めるのが難しいですが、標本の方の平均・分散を求めるのは簡単なので、標本の情報のみから母平均を区間推定できるこの手法は便利ですね。

  1. 母標準偏差が既知の場合  [パターン1]
  2. 母標準偏差が未知の場合(大標本:サンプル数が30以上) [パターン2]<ー 今回はこれを解説
  3. 母標準偏差が未知の場合(小標本:サンプル数が30未満)[パターン3]

 

例えば、日本の20歳の男子の平均身長を知りたいとしましょう。その時に、日本の20歳の男子全員の身長(母平均)を調べようとしたら、数十万人の身長の計測をしなければいけません。これは大変ですね。その代わりに、ランダムに選び出した1000人を選び出して、その人たちだけのデータの平均・分散(標本平均・標本分散)を求めるのは簡単です。この1000人だけのデータの平均・分散から、20歳の男子全員(数十万人)の身長の平均身長を求めることができれば、大変に便利です。これをするのが区間推定というわけです。(母分散が未知で大標本の場合)

 

母分散が未知で大標本の場合の母平均の区間推定の公式

まず、標本標準偏差sは、取り出してきたサンプルの標準偏差のことで、以下で与えられます。

s^2 = \frac{1}{n} \sum_{i=1}^n (X_i - \bar{X})^2

 

すると、母分散が未知で大標本の場合の母平均の区間推定は以下で与えれます。

\displaystyle P(\bar{X} - 1.96\times \frac{s}{\sqrt{n}} < \mu<\bar{X}+1.96\times\frac{s}{\sqrt{n}})=0.95

 

ここで、各パラメーターの意味を書いておきます。

\mu : 母平均、(これを知りたい!)

s : 標本標準偏差、(簡単に計算可能!)

\bar{X} : 標本(サンプル)平均 (簡単に計算可能!)

n : 標本(サンプル)の数 (当然知っている!)

P(***)=0.95 : ***となる確率が、0.95(95%)ということ。

 

この公式を見てもらえばわかると思いますが、母平均\mu 以外は、すべて標本の情報から計算することができます。

母分散が既知の場合の母平均の区間推定の公式(信頼区間99%)

信頼区間が99パーセントで推定する公式も同様に導くことができて以下のようになります。(パラメーターなどは上の公式と同じです。)

\displaystyle P(\bar{X} - 2.58\times \frac{s}{\sqrt{n}} < \mu<\bar{X}+2.58\times\frac{s}{\sqrt{n}})=0.99

例題

(例題) 日本全国の男子大学一年生の握力の強さを知りたい。そこで、大学一年生を100人を無作為に選んで、握力を調査をした。その100人の平均握力は40kgで、標本標準偏差は5kgであった。日本全国の男子大学一年生の平均握力に対する、95パーセントの信頼区間を求めよ。

(答) 上記の母平均の区間推定の公式に、問題のデータを入れると以下のようになる。(単に数字を代入するだけです。)

\displaystyle P(40 - 1.96\times \frac{5}{\sqrt{100}} < \mu<40+1.96\times\frac{5}{\sqrt{100}})=0.95

これを計算すると、

\displaystyle P(39.02 < \mu< 40.98)=0.95

この式は、日本全国の男子大学一年生の平均握力\muが、95パーセントの信頼係数で、以下の範囲にあることを示してる。

39.02(kg) < \mu< 40.98(kg)

 

母分散が既知の場合の区間推定との関係について

母分散\sigma^2 が既知の場合の母平均\muの区間推定は、ひとつ前のページで解説しました。推定の問題の中で、理論的にもっとも最初に導くことができるシンプルなケースだったが、設定自身は何とも不自然なものでした。知りたいはずの母集団の情報である母分散\sigma^2 がわかっているというのは、普通の状況ではありえないですね。

そこで、母平均\muの推定を、標本(サンプル)の情報だけから導けないであろうか?というのが疑問に対する答えが上の公式です。

標本数がある程度以上多い場合(標本数nが30以上)には、母分散\sigma^2 が既知の場合の理論構成を多少変更することによって、母平均\muを推定することができるというのがポイントです。(標本数nが30以上を大標本という。)

前セクション(母分散\sigma^2 が既知の場合)の区間推定の公式で、母標準偏差\sigma を標本標準偏差s で置き換えてOKな訳で、わかりやすくていいですね。
 
目次に戻る
 
●関連ページ
区間推定
母平均の区間推定(母分散が既知の場合)
母平均の区間推定(母分散が未知&大標本の場合)
母平均の区間推定(母分散が未知&小標本の場合)
母分散の区間推定

*このページの動画解説もしています。

 

コメントは停止中です。