母平均の区間推定(母分散が既知の場合)

Pocket

母集団の分散(母分散)があらかじめ分かっている場合、標本平均から母平均の区間推定をする方法を説明します。これは、母分散が分かっていない場合などの区間推定の基礎となります。

  1. 母標準偏差が既知の場合  [パターン1] <ー 今回はこれを解説
  2. 母標準偏差が未知の場合(大標本:サンプル数が30以上) [パターン2]
  3. 母標準偏差が未知の場合(小標本:サンプル数が30未満)[パターン3]

 

まず、区間推定とは何かを復習しておきましょう。区間推定とは、少ない数の標本(サンプル)の平均や標準偏差(または分散)から、母集団の平均や標準偏差(または分散)を推定する技術です。

 

標本平均\bar{X}や標本標準偏差s(標本) ⇒ 母平均\muや母標準偏差\sigma(母集団)

 

この区間推定には幾つかのパターンがありますが、まず最初に理解しなければいけないのは、今回説明する母標準偏差\sigmaが既知の場合の母平均\muの推定(パターン1)です。

 

よく考えてみると、この設定、つまり母標準偏差\sigmaがあらかじめ分かっているということは、かなり不自然な設定です(笑)。

 

本来、区間推定では、計算可能なサンプル集団の情報から、直接計算困難で莫大な数の母集団を情報を知りたいわけです。ところが、母標準偏差\sigmaは、その計算困難な母集団の方の情報です。当然、あらかじめ母標準偏差\sigmaはわかるわけないですね(笑)

(もちろん、適当に母標準偏差\sigmaを仮定することはできますが、、、)

 

しかし、なぜこの非現実的な区間推定の設定の場合を最初に勉強することには理由があります。実は、実際には使用することのないこのパターンを理解しないと、もっと実践的な他のパターンの区間推定を導出することができないので、統計学では、まず最初にこのパターンと学習することになります。

 

1、母分散が既知の場合の母平均の区間推定の公式(信頼区間95%)

母分散が既知の場合の母平均の区間推定の公式を導く上で、中心極限定理と正規分布の2つが重要になります。中心極限定理と正規分布の2つを組み合わせることにより、母平均を95パーセント信頼区間で推定する次の公式を導くことができます。

\displaystyle P(\bar{X} - 1.96\times \frac{\sigma}{\sqrt{n}} < \mu<\bar{X}+1.96\times\frac{\sigma}{\sqrt{n}})=0.95

 

ここで、各パラメーターの意味を書いておきます。

\mu : 母平均、(これを知りたい!)

\sigma : 母標準偏差、(パターン1の仮定から既知!)

\bar{X} : 標本(サンプル)平均 (サンプルから簡単に計算可能!)

n : 標本(サンプル)の数 (当然知っている!)

P(w)=0.95 : wとなる確率が、0.95(95%)ということ。

 

この公式を良く見てみると、 母平均\mu以外はわかっています。そこで、わかっている情報を、この公式に代入することによって、母平均を統計的に見積もることができることになります。(母分散が分かっている場合の母平均の区間推定)

 

2、母分散が既知の場合の母平均の区間推定の公式(信頼区間99%)

 

信頼区間が99パーセントで推定する公式も同様に導くことができて以下のようになります。(パラメーターなどは上の公式と同じです。)

\displaystyle P(\bar{X} - 2.58\times \frac{\sigma}{\sqrt{n}} < \mu<\bar{X}+2.58\times\frac{\sigma}{\sqrt{n}})=0.99

 

3、例題

さっそく例題をやってみましょう。

(例題)ある国の20才の男性全員の平均身長を知りたい。900人(n)の標本(サンプル)を取ってきて、その標本の平均が170cm(\bar{X}) だったとする。ここで、なんらかの理由で、母標準偏差が10cm(\sigma) だったことが分かった。この国の20才男性全員の真の平均身長(\mu)を、信頼区間95%で区間推定せよ。

(この問題で、母標準偏差がわかっているところが不自然なところですね。ただまあ日本人であれば、身長の高い人と低い人では、平均から大体±10cm位の範囲で収まっているだろうから、このように仮定してもOKでしょう。母標準偏差が精密にわかっていなくても、大きめに見積もっておけば実際上は問題はあります。)

(答)さっそく、最初の公式(95%信頼区間の公式)に数字を代入してみましょう。

\displaystyle \bar{X} -1.96\times \frac{\sigma}{\sqrt{n}}=170-1.96\times\frac{10}{\sqrt{30}}=170-0.65=169.35 \displaystyle \bar{X} +1.96\times \frac{\sigma}{\sqrt{n}}=170+1.96\times\frac{10}{\sqrt{30}}=170+0.65=170.65

 

よって、

\displaystyle P(169.35< \mu<170.65)=0.95

 

この式は、この国の20才男性全員の真の平均身長(\mu)が、169.35cm< \mu<170.65cmの範囲に入っている確率が、95%であることを示しています。(←これがこの問題の答えです。)

コメントですが、例えばこの国に100万人の20才男性がいるとして、その真の平均身長が、100万人のうち、たった900人調べるだけで、±0.65cmの誤差でわかってしまうのは、素晴らしいことですね。

 
目次に戻る
 
●関連ページ
区間推定
母平均の区間推定(母分散が既知の場合)
母平均の区間推定(母分散が未知&大標本の場合)
母平均の区間推定(母分散が未知&小標本の場合)
母分散の区間推定

 

*このページの動画解説もしています。

コメントは停止中です。