母平均の差に対する検定(分散が等しい場合)

2つの母集団の母平均に差があるかどうかの検定を解説します。母分散が等しい場合と、母分散が等しいかどうかわからない場合がありますが、ここでは母分散が等しいことがわかっている場合を解説します。母平均が異なることを示したい時にこの検定を用いますが、応用上最も重要です。

例えば、薬の薬効を調べる時などに、薬を投与をするグループと、薬を投与しないグループに分けて検査結果に差に意味があるかどうかの検定をする時などに使います。

 

母分散が等しい2つの正規母集団(正規分布に従う母集団)があるとします。それぞれの母平均は[latex]\mu_1[/latex]と[latex]\mu_2[/latex]で、母分散は共通の[latex]\sigma^2[/latex]とします。

母平均に差があるかどうかを判定するための帰無仮説[latex]H_0[/latex](証明したいことの反対のこと)と、対立仮説[latex]H_1[/latex](証明したいこと)は次のように設定します。

[latex size=2]\displaystyle H_0: \mu_1 = \mu_0[/latex]

 

[latex size=2]\displaystyle H_1: \mu \neq \mu_0[/latex]

 

帰無仮説[latex]H_0[/latex](証明したいことの反対のこと)を仮定します。2つの母集団から取り出された標本の標本平均をそれぞれ[latex]\bar{X}_1[/latex]、[latex]\bar{X}_2[/latex]とし、また標本分散をそれぞれ[latex]s^2_1[/latex]、[latex]s^2_2[/latex]とします。

また、2つの母集団からのそれぞれn個とm個の標本[latex]X_1,X_2,\cdots,X_n[/latex]と[latex]Y_1,Y_2,\cdots,Y_n[/latex]をサンプリングして、そこから計算した合併標本分散[latex]s^2[/latex]を次で定義します。

[latex size=2]\displaystyle s^2 = \frac{1}{n+m-2}\times \Bigl\{\sum_{i=1}^n (X_i-\bar{X})^2+\sum_{j=1}^m (Y_j-\bar{Y})^2\Bigr\}[/latex]
 

すると、2つの母集団の母分散[latex]\sigma^2[/latex]が等しい場合、次の統計量

[latex size=2]\displaystyle t=\frac{(\bar{X}-\bar{Y})-(\mu_1-\mu_2)}{\sqrt{s^2(1/n+1/m)}}[/latex]

 
は自由度が[latex](m+n-2)[/latex]のt分布に従うことが知られています。(母分散が未知かつ等しい場合の標本平均の差の標本分布)ここで、実際にサンプリングした標本の標本平均[latex]\bar{X}_1[/latex]、[latex]\bar{X}_2[/latex]と合併分散[latex]s^2_1[/latex]を用いて計算したこの統計量を[latex]t_0[/latex]とすると、p値(p-value)は次のように計算されます。両側検定の場合は、

[latex size=2]\displaystyle p=P(t>|t_0|)+P(t<-|t_0|)=2P(t>|t_0|)[/latex]
 
片側検定の場合は、

[latex size=2]\displaystyle p=P(t>|t_0|)[/latex]
 
となります。このp値(p-value)がはじめに設定した有意水準より小さければ帰無仮説は棄却され、対立仮説が採択されることになります。