中心極限定理

Pocket

中心極限定理は、どのような母集団であっても(正規分布でなくても)十分な数の標本(サンプル)を取ってくれば標本平均は正規分布に従い、さらに標本平均の母平均からの誤差がサンプル数の増大と共に小さくなることを示しています。この定理は統計的推測や検定の基礎となります。例えば、中心極限定理によって、どれくらい標本を取ってくれば、母平均を正確に推定できるのかがわかります。

中心極限定理があるので、あらゆる分布の中で正規分布が最も重要ということがわかります。また、中心極限定理は正規分布とともに、統計的推測を理解のための重要な柱となります。

 

中心極限定理とその要点

さっそく中心極限定理の内容を見ていきましょう。

<中心極限定理>
平均\mu、 分散\sigma^2の母集団からの取り出されたサンプル数nの標本(サンプル)の平均\bar{X}の分布は、nが十分大きければ、近似的に平均\mu、分散\sigma^2/nの正規分布に従う。

 

この定理の要点は2つあります。

1、母集団が正規分布でなくても十分性質の良い分布の場合は、標本(サンプル)平均は正規分布に従うというのが重要です。ただし、母集団が平均\mu、 分散\sigma^2の意味を失うような分布(例えばべき乗分布など)の場合は、この定理は使えません。

 

2、標準偏差は分散の平方なので、標本平均の標準偏差は、母集団の標準偏差の1/\sqrt{n}になるます。つまり、サンプル数をnを増やすと、標本平均\bar{X}の母平均\muからのズレがどんどんなくなっていく(精度が良くなる)ということになります。

 

例えば、900個のサンプルをとってくると、標本平均と母平均の間のズレが母標準偏差の30分の1になります。

例として、20歳の日本男性の平均身長を900人のサンプルから見積もることを考えてみましょう。母標準偏差は10cmくらいと見積もることにしましょう。(周りの人を見れば、ほとんどの人の身長は平均身長の±10cmの間に収まっていると仮定してもおかしくないと思われます。)すると、900人のサンプルを取ってくれば、標本平均の標準偏差は10cmの30分の1になるので、およそ0.3cmということになります。これは、900人のサンプルを取ってくれば、何十万人といる日本男性の平均身長をたった0.3cmの誤差で知ることができるわけです。中心極限定理って素晴らしいですね(笑)

 

中心極限定理が成り立たない場合

もとの母集団に平均や分散が存在しない場合は、中心極限定理は成り立ちません。その場合は安定分布を持ちいた他の理論が存在します。母集団に平均や分散が存在しないとはどんな場合でしょうか?典型的な例は、分布の裾野がべき乗則に従う場合です。これをファットテールと言います。

 

母集団の分布の裾野(kが大きいところ)が、べき乗則f(k)\propto k^{-\gamma}に従うとしましょう。すると、べき乗則の指数\gammaによって、以下のように中心極限定理が成立する場合と、しない場合があります。

(1) 指数 \gamma > 3 の時、母集団の期待値、分散が両方とも有限であり、中心極限定理が成立する。

(2) 指数 3> \gamma > 2 の時、母集団の期待値は有限であるが、分散は発散する。中心極限定理は成立しない。しかしその場合でも、中心刻限定理の一部として、母集団からの取り出された標本(サンプル)の平均\bar{X}の分布は、平均\muに収束する事実は成立する。(大数の法則)

(3) 指数 2> \gamma > 1 の時、母集団の期待値、分散両方とも発散する。中心極限定理は成立しない。

 
目次に戻る

●関連ページ

平均、分散、標準偏差
共分散・共分散行列
相関係数・相関行列
中心極限定理
統計的推測の概論

 

*このページの動画解説もしています。

コメントは停止中です。