確率変数の共分散と相関係数

2次元の確率変数の共分散(covariance)と相関係数(correlation coefficient)を説明します。共分散と相関係数は両方とも、2つの確率変数の間の関係を表します。共分散と相関係数の両方とも似たような概念なのですが、相関関数の方は、共分散の方を規格化しているという違いがあります。では早速詳しい定義を見ていきましょう。

共分散(covariance)

2つの確率変数XとYに対して、共分散は以下で定義されます。

[latex size=2]\displaystyle Cov(X,Y)=E((X-E(X)(Y-E(Y)))[/latex]

 

[latex size=]E(X)[/latex]と[latex size=]E(Y)[/latex]は、それぞれ2つの確率変数XとYの期待値を表します。また、[latex size]E((X-E(X)(Y-E(Y)))[/latex]は、確率変数[latex size](X-E(X)(Y-E(Y))[/latex]の期待値を表します。

共分散が、正(プラス)の値をとるとき、2つの確率変数は、同じ方向に変動します。また逆に、負(マイナス)の値をとるときに、2つの確率変数は逆の方向に動きます。

ちなみに、[latex size]\displaystyle Cov(X,X)[/latex]は確率変数Xの分散と同じになります。

共分散には、上の定義式の他にも別の計算方法があります。それが次の共分散の別公式です。

[latex size=2]\displaystyle Cov(X,Y)=E(XY)-E(X)E(Y)[/latex]
 

もちろん最初の共分散の定義式(一番目の式)を用いても、この共分散の別公式(2番目の式)を用いても答えは同じになります。

 

相関係数(correlation coefficient)

通常は2つの確率変数の関係を調べるのには、共分散よりも次に説明する相関係数の方を使うことが多いです。
2つの確率変数XとYに対して、相関係数[latex]\rho(X,Y)[/latex]は以下で定義されます。

[latex size=2]\displaystyle \rho(X,Y)=\frac{Cov(X,Y)}{s(X)s(Y)}[/latex]

 

相関係数は、共分散を規格化したもので、-1から1までの範囲の値をとります。相関係数が1に近ければ、2つの確率変数XとYは同じ方向に変動します。また、相関係数が-1に近ければ、2つの確率変数XとYは逆の方向に変動します。

また、自分自身との相関係数[latex]\rho(X,X)[/latex]は常に1になります。