Rによる平均、分散、標準偏差の計算

Pocket

Rによる平均、分散、標準偏差の計算を解説します。

データの準備

例として、次の5人の身長のデータを考えてみます。

165,178,187,162,171(cm)

このデータをRで扱うために、heightと言う変数に5つのデータを代入します。

実際に変数heightに代入されたデータを見てみましょう。

 

平均

このデータの平均を求めてみましょう。2つの方法があります。

まずはsum関数を使う方法です。5つのデータをsum関数で足した後に、データの個数で割ります。

もう一つの方法はもっと直接的な方法で、mean関数を使う方法です。(ちなみにmeantとは英語で平均という意味です。)

sum関数を使っても、mean関数を使っても同じ平均値172.6が出てきます。

分散

次にこのデータの分散を求めてみましょう。2つの方法があります。まずは分散の定義に従って、ガリガリ計算してみましょう。(ここでは不偏標本分散を計算します。なのでデータの個数−1で割ります。)

 

もっと直接的な方法はvar関数を使うことです。

両方の方法とも同じ結果を与えます。ここでvar関数は不偏標本分散を計算していることに注意しましょう。(つまり、データ数で割るのではなく、(データ数−1)で割るということです。)

標準偏差

標準偏差も2つのやり方で計算してみます。まずは標準偏差の定義に従って、分散の平方根を計算して標準偏差を求めてみましょう。

もっと直接的な方法としては、sd関数を使う方法があります。

当然ながら両方の計算結果は一致します。
 

コメントは停止中です。