仮説検定のやさしい解説

Pocket

仮説検定(statistical hypothesis testing)は、薬の薬効が本当にあるのか、実験などで出た結果が本当に意味があるのか、または偶然にすぎないのかなど、さまざまな仮説をデータから、検証するための手法です。仮説検定の手順は以下の通りです。

(1)帰無仮説(null hypothesis)と対立仮説(alternative hypothesis)の設定

(2)帰無仮説に基づき、検定統計量の従う確率分布を求める。

(3)有意水準(危険域)\alphaの設定。

(4)実際に観測された検定統計量からp値を計算する。

(5)有意水準(危険域)\alphaとp値を比較して帰無仮説を棄却するかどうかを決定する。

 

さて、この手順を詳しく順を追って見ていきましょう。

 

1、帰無仮説(null hypothesis)と対立仮説(alternative hypothesis)の設定

仮説検定では、対立仮説(alternative hypothesis)と帰無仮説(null hypothesis)という2つの仮説をたてます。帰無仮説は、それが成り立つと仮定した場合、検定したい統計量の確率分布を求めることができるものを採用します。対立仮説と帰無仮説は互いに否定の関係にあります。

なぜ、このように帰無仮説をいうものを考えるのには理由があります。統計的に証明したいこと(たとえば薬効がある。コインが歪んでいる。)よりもそれを否定する命題(帰無仮説)の方が、確率分布を求めやすいからです。

たとえば、何回かコインを投げて表が出る回数の確率分布を求めることは、コインが歪んでいるとした場合は難しいですが、コインが歪んでいない場合は簡単です。(2項分布になります。)

具体的には表か裏のあるコインが歪んでいるかどうかを検証するときは、次のように仮説を立てます。

帰無仮説(H_0):コインは歪んでおらず、表と裏が出る確率は等しく0.5である。
対立仮説(H_1):コインは歪んでいて、表と裏の出る確率は等しくない。

 

また別の例では、ある薬Aが本当に薬効があるのかどうか検証するときは、次のように仮説を立てます。

帰無仮説(H_0):ある薬Aは、偽薬(ただの栄養剤)と同じ効果しかない。
対立仮説(H_1):ある薬は、偽薬(ただの栄養剤)より効果がある。

そして、実際にえられたデータから、帰無仮説「ある薬Aは、偽薬(ただの栄養剤)と同じ効果しかない。」が正しくないということを統計的に示して、対立仮説「ある薬は、偽薬(ただの栄養剤)より効果がある。」ということを証明します。

 

多くの場合、この二つの仮説は、非常に大ざっぱな言い方をすると次のようになることが多いです。

帰無仮説(H_0):ウソだと証明したいこと。(コインは歪んでいない。薬効がないなど)
対立仮説(H_1):本当だと証明したいこと。(コインが歪んでいる。薬効があるなど)

 

あまり、ロジックにとらわれると、何が何だかわからなくなることもあるが、具体例に数多く接しして、だんだんと身につけるのが良いでしょう。(あまり最初から具体例や具体的な計算せずに、ロジックだけ考えていると混乱するので、最初はそんなものかぐらいの理解で良いでしょう。)

 

2、帰無仮説に基づき、検定統計量の従う確率分布を求める。

帰無仮説が正しいとした時に、確率論を用いて、検定統計量が従う確率分布を求めます。

 

たとえば、コイントスの問題で、コインが歪んでいないという帰無仮説を採用した場合、n回コインを投げた時にp回表が出る確率は2項分布になります。よって、コイントスの場合の統計検定量(何回表が出たか)の従う分布は以下のようになります。

\displaystyle P(X=p)={}_nC_p(\frac{1}{2})^n

 

3、有意水準(危険域)\alphaの設定。

有意水準(危険域)\alphaは、帰無仮説が正しいとして,検定統計量の確率分布全体を棄却域と採択域に分割し,帰無仮説が棄却域にはいる確率のことです。通常は、有意水準(危険域)\alphaとして5%や1%を使います。有意水準が5%の場合、帰無仮説が正しいのにも関わらず、5%の確率で誤って対立仮説を採用してしまう危険性があるというわけです。

 

4、実際に観測された検定統計量からp値を計算する。

帰無仮説を仮定したとき、実際に観測された検定統計量より、さらに異常値を取る確率をp値(p value)と呼びます。このp値が小さいということは、帰無仮説がウソくさいということを示唆しており、対立仮説(ある薬には薬効がある。)ということが真実である可能性が高いということになります。

先ほどのコイントスの問題で、10回中1回表が出て、9回裏が出たとするとp値は次のようになります。1回表が出るより極端な事象は、(1回表が出る、)1回も表が出ない、9回表出る、10回すべて表が出るです。

\displaystyle p=P(X=0)+P(X=1)+P(X=9)+P(X=10)=\frac{1}{1024}+\frac{10}{1024}+\frac{10}{1024}+\frac{1}{1024}=\frac{11}{512}=0.021

 

5、有意水準(危険域)\alphaとp値を比較して帰無仮説を棄却するかどうかを決定する。

このp値を、有意水準(危険域)\alphaと比較して、p<\alphaならば帰無仮説が棄却されて対立仮説が採用されます。反対にp>\alphaの時は、帰無仮説は棄却されず対立仮説は採用されません。

 

先ほどのコイントスの問題の場合で、有意水準(危険域)\alphaを5%とすれば、10回中1回表が出たという事象のp値は2.1%で、p<\alphaなので帰無仮説(正確なコイン)が棄却されて対立仮説(歪んだコイン)が採用されます。つまり、5%の有意水準の場合、10回中1回しか表が出なければコインは歪んでいると結論付けることになります。

ちなみに、このコイントスの問題の場合で、有意水準(危険域)\alphaを1%とすれp>\alphaなので帰無仮説(正確コイン)は棄却されず対立仮説(コインは歪んでいない)は採用されません。つまり、1%の有意水準の場合、10回中1回しか表が出なくてもコインが歪んでいるとは結論できずに正確なコインがたまたま珍しい現象(10回中1回しか表が出ない)を起こしたと解釈されるわけです。

帰無仮説、対立仮説、p値の概念は抽象的に考え始めると、わかりにくいが、実査に具体的な問題で、いろいろ数値を計算始めると、すぐにできるので、初歩の段階では、分からなくてもあまり悩まずに先に進むほうがよいでしょう。

コメントは停止中です。