標本平均の差の標本分布(母分散が未知かつ等しい場合)

2つの正規分布があったとして、そこからそれぞれ独立に標本を取り出した時の標本平均の差の分布は、推定や検定などによく用いられます。今回は、特に母分散が未知だけれども2つの母分散が等しい場合を解説します。まず最初に、母分散が既知の場合の標本平均の差の分布の場合を復習してから、2つの母分散が未知かつ等しい場合を見ていきましょう。

 

標本平均の差の標本分布(母分散が既知の場合)の復習

母平均[latex]\mu_1[/latex]、母分散[latex]\sigma^2[/latex]を一つの正規母集団とし、母平均[latex]\mu_2[/latex]、母分散[latex]\sigma^2[/latex]をもう一つの正規母集団とします。この2つの正規母集団(母集団が正規分布に従う。)からそれぞれ標本を取り出すことを考えます。ここで重要な仮定として、この2つの母集団の分散は共通で同じとします。(この仮定が成り立たない場合は、これより少し難しいので別ページで解説します。)

この2つの正規母集団から、それぞれn個とm個の標本[latex]X_1,X_2,\cdots,X_n[/latex]と[latex]Y_1,Y_2,\cdots,Y_n[/latex]を得たすると、それぞれの標本平均[latex]\bar{X}[/latex]と[latex]\bar{Y}[/latex]は以下のようになります。

[latex size=2]\displaystyle \bar{X} = \frac{1}{n}\times \sum_{i=1}^n X_i = \frac{1}{n}\times(X_1 + X_2 + X_3 + \cdots + X_n)[/latex]
[latex size=2]\displaystyle \bar{Y} = \frac{1}{m}\times \sum_{i=1}^m Y_i = \frac{1}{m}\times(Y_1 + Y_2 + Y_3 + \cdots + Y_m)[/latex]

 

この標本平均の差[latex]\bar{X}-\bar{Y}[/latex]は、平均[latex]\mu_1-\mu_2[/latex]で分散[latex]\sigma^2(1/n+1/m)[/latex]の正規分布[latex]N(\mu_1-\mu_2,\sigma^2(1/n+1/m))[/latex]に従うことが知られています。よって、標本平均の差[latex]\bar{X}-\bar{Y}[/latex]を標準化をした標準化変数Z

[latex size=2]\displaystyle Z=\frac{(\bar{X}-\bar{Y})-(\mu_1-\mu_2)}{\sqrt{\sigma^2(1/n+1/m)}}[/latex]

 

は標準正規分布[latex]N(0,1)[/latex]に従います。ところが2つの母集団に共通の母分散[latex]\sigma^2[/latex]が未知だと、この式は計算できません。ということで、困った事態になっているのですが、実は共通の母分散[latex]\sigma^2[/latex]がわからなくても、標本平均の差が従う分布がわかるようにすることができます。上式の母分散[latex]\sigma^2[/latex]を標本の方から計算した標本分散で置き換えると全て上手くのです。このことを次で説明します。

標本平均の差の標本分布(母分散が未知かつ等しい場合)

前式だと、2つの母集団に共通の母分散[latex]\sigma^2[/latex]が未知で計算ができません。そこで、この母分散[latex]\sigma^2[/latex]の代わりに、2つの母集団からの標本から計算した次で定義される合併した標本分散[latex]s^2[/latex]を使います。

[latex size=2]\displaystyle s^2 = \frac{1}{n+m-2}\times \Bigl\{\sum_{i=1}^n (X_i-\bar{X})^2+\sum_{j=1}^m (Y_j-\bar{Y})^2\Bigr\}[/latex]

 

2つ前の式で、共通の母分散[latex]\sigma^2[/latex]をこの合併した標本分散[latex]s^2[/latex]で置き換えた統計量を「2標本t統計量」と呼び、次で定義されます。

[latex size=2]\displaystyle t=\frac{(\bar{X}-\bar{Y})-(\mu_1-\mu_2)}{\sqrt{s^2(1/n+1/m)}}[/latex]

 

この統計量[latex]t[/latex]は自由度が[latex](m+n-2)[/latex]のt分布に従うことが知られています。

この式は、母分散が等しいが未知の時の標本平均の差の検定に用いられます。

 

目次に戻る

●関連ページ

標本平均の標本分布(母分散が既知の場合)
標本平均の標本分布(母分散が未知の場合)
標本分散の標本分布
標本平均の差の標本分布(母分散が既知の場合)
標本平均の差の標本分布(母分散が未知かつ等しい場合)
標本平均の差の標本分布(母分散が未知かつ等しいとはわからない場合)
標本分散の比の標本分布
標本相関係数の標本分布