平均、分散、標準偏差

Pocket

データが与えられた時に、そのデータの特徴を見るために計算される量が統計量です。その統計量の代表的なものが平均、分散、標準偏差です。

1、平均 (average, mean)

平均は、集団の統計量として最も良く使われる尺度です。

n個の観測量(例えば身長など)を、x_i~(i=1,2,3,\cdots,n)とする時、平均\bar{x}は、以下で定義されます。

\displaystyle \bar{x} = \frac{1}{n}\times \sum_{i=1}^n x_i = \frac{1}{n}\times(x_1 + x_2 + x_3 + \cdots + x_n)

 

さて早速、平均の例を見てみましょう。

(例題)次の男性5人の身長の平均を求めよ。

5人の身長データ:178,165,171,163,173 (cm)

x_1 178cm
x_2 165cm
x_3 171cm
x_4 163cm
x_5 173cm

 

(答)平均の定義式より次のように計算できます。

\displaystyle \bar{x} = \frac{1}{5}\times \sum_{i=1}^n x_i = \frac{1}{5}\times (x_1 + x_2 + x_3 + x_4 + x_5)\\~~~~=\frac{1}{5}\times (178 + 165 + 171 + 163 + 173) = 170 (cm)

 

2、分散 (variance)

分散は、集団に対する観測量の平均からのばらつき具合を表します。分散V[x]は以下の式で定義されます。

 

\displaystyle V[x] = \frac{1}{n}\times \sum_{i=1}^n (x_i-\bar{x})^2\\  ~~~~~~= \frac{1}{n}\times \Bigl\{(x_1-\bar{x})^2 + (x_2-\bar{x})^2 + \cdots + (x_n-\bar{x})^2 \Bigr\}

 

(注意)標本に対する分散(不偏分散)の場合は、nではなくて(n-1)で割る。
 
(例)上記の例題で、分散を計算すると、以下のようになります。

\displaystyle V[x] = \frac{1}{5}\times \sum_{i=1}^5 (x_i-\bar{x})^2\\  ~~~~~ = \frac{1}{5}\times \Bigl\{(x_1-\bar{x})^2 + (x_2-\bar{x})^2 + (x_3-\bar{x})^2 + (x_4-\bar{x})^2 + (x_5-\bar{x})^2 \Bigr\}\\  ~~~~~ = \frac{1}{5}\times \Bigl\{(178-170)^2 + (165-170)^2 + (171-170)^2 + (163-170)^2 + (173-170)^2 \Bigr\}\\  ~~~~~ = \frac{1}{5}\times \Bigl\{8^2 + 5^2 + 1^2 + 7^2 + 3^2 \Bigr\}\\  ~~~~~ = 29.6 ~~(\mbox{cm}^2)

 

ここで、気をつけてほしいところは、分散の単位(上の例だと \mbox{cm}^2)が、もともとの単位(cm)の二乗になっていることです。分散の単位が、元の単位と異なってしまっているいて意味がわかりにくので、分散の代わりに次のように定義される標準偏差を使うことも多いです。

 

3、標準偏差 (Standard Deviation)

標準偏差S[x]は、分散V[x]の平方根として定義されます。

S[x]=\sqrt{V[x]}

 

(例)上記の例題の場合だと、標準偏差は以下のようになります。

S[x]=\sqrt{V[x]}=\sqrt{29.6}=5.4~~(\mbox{cm})

 

これ例でもわかる通り、標準偏差の定義は、元の単位(この例だとcm)と同じであることに注意しましょう。単位が扱いやすいために、分散よりも標準偏差が使われることが多いです。ただし、標準偏差を求める時に分散を計算する必要があるので、結局両方のところ計算しなければなりません。

目次に戻る

●関連ページ

平均、分散、標準偏差
共分散・共分散行列
相関係数・相関行列
中心極限定理
統計的推測の概論

 

*このページの動画解説もしています。

 

コメントは停止中です。