t分布

Pocket

t分布(t-distribution)はスチューデントのt分布(Student’s t-distribution)などとも呼ばれ、母分散が未知で小標本の場合(標本数30以下)の母平均の区間推定などに用いられます。

t分布の定義

まずは、t分布の定義は以下の通りです。

\displaystyle f(t)=\frac{\Gamma(\frac{m+1}{2})}{\sqrt{m\pi}\Gamma(\frac{m}{2})}\Bigl(1+\frac{t^2}{m}\Bigr)^{-\frac{m+1}{2}}

 

ここで、\Gamma(x)はガンマ関数と呼ばれる特殊関数です。そして、t分布の基本的な変数はtですが、この定義式にはもう一つのパラメーターmがあり、それは自由度と呼ばれます。この自由度mは、区間推定をする時の標本数と関係してくることがわかります。

t分布の定義は、特殊関数を用いられており複雑な数式ですが、区間推定などのデータ解析などを実際にする場合は、この数式からいちいち計算することはあまりなく、教科書の付録などについているt分布の一覧表を使うか、エクセルなどの統計計算ソフトを使うことがほとんどです。なので、t分布はとりあえずこんな数式なのかと思って、大雑把な理解で先に進む方が良いでしょう。

 

t分布の性質

t分布の重要な性質の一つは、「t分布の自由度mが大きい時は、t分布は正規分布に似てくる」というものです。実際には、およそ自由度m>30位を境に、t分布と正規分布はほとんどの見分けがつかなくなります。この辺の事情が、母分散が未知の時の母平均の区間推定が、大標本(標本数30以上)の時と、小標本(標本数30未満)の時で異なるやり方になる理由と成ります。つまり、母分散が未知の時の母平均の区間推定が、大標本(標本数30以上)の場合は「正規分布」を用いて、小標本(標本数30未満)の場合は「t分布」を用いることになるのです。

また、t分布は、自由度mが小さくなると、分布のプラスとマイナスの両方の裾野が厚くという性質もあります。

t分布と統計学との関係

t分布で統計学への応用上大切なのは次の定理です。\muを母平均、\bar{X}を標本平均、sを標本標準偏差、nを標本数(サンプル数)とします。すると、

\displaystyle t=\frac{\bar{X}-\mu}{\frac{s}{\sqrt{n}}}

 

で定義される量は、自由度m=n-1のt分布になることを証明することができます。この事実は、小標本で母分散がわからない場合の母平均の区間推定に応用されます。

そして、サンプル数nが大きくなり、30以上になると、この式は正規分布に近づき、小標本で母分散がわからない場合の母平均の区間推定の問題は大標本で母分散がわからない場合の母平均の区間推定の問題に帰着されるというわけです。

コメントは停止中です。