確率変数の共分散と相関係数

Pocket

2次元の確率変数の共分散(covariance)と相関係数(correlation coefficient)を説明します。共分散と相関係数は両方とも、2つの確率変数の間の関係を表します。共分散と相関係数の両方とも似たような概念なのですが、相関関数の方は、共分散の方を規格化しているという違いがあります。では早速詳しい定義を見ていきましょう。

共分散(covariance)

2つの確率変数XとYに対して、共分散は以下で定義されます。

\displaystyle Cov(X,Y)=E((X-E(X)(Y-E(Y)))

 

E(X)E(Y)は、それぞれ2つの確率変数XとYの期待値を表します。また、E((X-E(X)(Y-E(Y)))は、確率変数(X-E(X)(Y-E(Y))の期待値を表します。

共分散が、正(プラス)の値をとるとき、2つの確率変数は、同じ方向に変動します。また逆に、負(マイナス)の値をとるときに、2つの確率変数は逆の方向に動きます。

ちなみに、\displaystyle Cov(X,X)は確率変数Xの分散と同じになります。

共分散には、上の定義式の他にも別の計算方法があります。それが次の共分散の別公式です。

\displaystyle Cov(X,Y)=E(XY)-E(X)E(Y)  

もちろん最初の共分散の定義式(一番目の式)を用いても、この共分散の別公式(2番目の式)を用いても答えは同じになります。

 

相関係数(correlation coefficient)

通常は2つの確率変数の関係を調べるのには、共分散よりも次に説明する相関係数の方を使うことが多いです。
2つの確率変数XとYに対して、相関係数\rho(X,Y)は以下で定義されます。

\displaystyle \rho(X,Y)=\frac{Cov(X,Y)}{s(X)s(Y)}

 

相関係数は、共分散を規格化したもので、-1から1までの範囲の値をとります。相関係数が1に近ければ、2つの確率変数XとYは同じ方向に変動します。また、相関係数が-1に近ければ、2つの確率変数XとYは逆の方向に変動します。

また、自分自身との相関係数\rho(X,X)は常に1になります。

コメントは停止中です。