母平均の差に対する検定:ウェルチの検定(分散が等しくない場合)

分散が等しくない2つの母集団の母平均に差があるかどうかの検定(ウェルチの検定:Welch’s test)を解説します。母分散が等しい場合より複雑になります。

 

2つの正規母集団(正規分布に従う母集団)があるとします。それぞれの母平均は[latex]\mu_1[/latex]と[latex]\mu_2[/latex]で、母分散は[latex]\sigma_1^2[/latex]と[latex]\sigma_2^2[/latex]とします。

母平均に差があるかどうかを判定するための帰無仮説[latex]H_0[/latex](証明したいことの反対のこと)と、対立仮説[latex]H_1[/latex](証明したいこと)は次のように設定します。

[latex size=2]\displaystyle H_0: \mu_1 = \mu_2[/latex]

 

[latex size=2]\displaystyle H_1: \mu_1 \neq \mu_2[/latex]

 

帰無仮説[latex]H_0[/latex](証明したいことの反対のこと)を仮定します。2つの母集団から取り出された標本の標本平均をそれぞれ[latex]\bar{X}_1[/latex]、[latex]\bar{X}_2[/latex]とし、また標本分散をそれぞれ[latex]s^2_1[/latex]、[latex]s^2_2[/latex]とします。

すると、次の統計量

 

[latex size=2]\displaystyle t=\frac{(\bar{X}-\bar{Y})-(\mu_1-\mu_2)}{\sqrt{s_1^2/n+s_2^2/m}}[/latex]

 

は近似的に自由度が

 

[latex size=2]\displaystyle v=\frac{(\frac{s_1^2}{n}+\frac{s_2^2}{m})^2}{\frac{(s_1^2/n)^2}{n-1}+\frac{(s_2^2/n)^2}{m-1}}[/latex]

 

のt分布に従うことが知られています。(ウェルチの近似法

ここで、実際にサンプリングした標本の標本平均[latex]\bar{X}_1[/latex]、[latex]\bar{X}_2[/latex]と標本分散をそれぞれ[latex]s^2_1[/latex]、[latex]s^2_2[/latex]を用いて計算したこの統計量を[latex]t_0[/latex]とすると、p値(p-value)は次のように計算されます。両側検定の場合は、

[latex size=2]\displaystyle p=P(t>|t_0|)+P(t<-|t_0|)=2P(t>|t_0|)[/latex]

 

片側検定の場合は、

[latex size=2]\displaystyle p=P(t>|t_0|)[/latex]

 

となります。このp値(p-value)がはじめに設定した有意水準より小さければ帰無仮説は棄却され、対立仮説が採択されることになります。