条件付き期待値・条件付き分散

条件付き確率分布についても、期待値と分散を考えることができ、それぞれ条件付き期待値(conditional expectation)と条件付き分散(conditional variance)といいます。2変数確率変数を考えたとき、片方の確率変数の値が確定したときに、もう一つの確率変数がとる期待値と分散が、条件付き期待値と条件付き分散となります。

条件付き期待値

2つの確率変数[latex]X,Y[/latex]があったとしましょう。一方の確率変数が[latex]Y=y[/latex]という値をとったという前提のもとで、もう一方の変数[latex]X[/latex]の条件付き期待値(離散型)は以下で与えられます。

[latex size=2]\displaystyle E(X|Y=y)=\sum_x xg(x|y)[/latex]

ここで、[latex]\displaystyle g(x|y)[/latex]は条件付き確率分布で、一方の確率変数が[latex]Y=y[/latex]という確定値をとった時に、もう一方の変数[latex]X[/latex]が、[latex]X=x[/latex]という値をとる確率で定義されます。

条件付き期待値[latex]E(X|Y=y)[/latex]の記号の意味を解説しておきます。縦棒の[latex]|[/latex]の右側は確定条件を表しており、この場合確率変数[latex]Y[/latex]が確定値[latex]Y=y[/latex]をとることを意味します。その条件の下で、確率変数[latex]X[/latex]の期待値を求めるのが条件付き期待値というわけです。

また離散型の時と同様に、連続型の確率変数の場合は、条件付き期待値は以下で与えられます。

[latex size=2]\displaystyle E(X|Y=y)=\int_{-\infty}^\infty xg(x|y)dx[/latex]

確率変数が離散型と連続型の場合の違いは、和のΣ記号が、積分記号に置き換わっただけです。積分は、無限個の足し算と解釈することができるからです。

 

条件付き分散

離散型の確率変数の場合、一方の確率変数が[latex]Y=y[/latex]という値をとったという前提のもとで、もう一方の変数[latex]X[/latex]の条件付き分散(離散型)は以下で与えられます。

[latex size=2]\displaystyle V(X|Y=y)=\sum_x (x-E(X|Y=y))^2g(x|y)[/latex]

ここで、[latex]E(X|Y=y)[/latex]は先ほど定義した条件付き期待値です。そして[latex]\displaystyle g(x|y)[/latex]は、先ほども説明しましたが条件付き確率分布で、一方の確率変数が[latex]Y=y[/latex]という確定値をとった時に、もう一方の変数[latex]X[/latex]が、[latex]X=x[/latex]という値をとる確率で定義されます。

条件付き分散[latex]V(X|Y=y)[/latex]の記号の意味を解説しておきます。先ほどと同様に縦棒の[latex]|[/latex]の右側は確定条件を表しており、この場合確率変数[latex]Y[/latex]が確定値[latex]Y=y[/latex]をとることを意味します。その条件の下で、確率変数[latex]X[/latex]の分散を求めるのが条件付き分散というわけです。

また離散型の時と同様に、連続型の確率変数の場合は、条件付き分散は以下で与えられます。

[latex size=2]\displaystyle V(X|Y=y)=\int_{-\infty}^\infty (x-E(X|Y=y))^2g(x|y)dx[/latex]

先ほどと同様で、確率変数が離散型と連続型の場合の違いは、和のΣ記号が、積分記号に置き換わっただけですね。

追記:良い統計学の参考書を見つけたのでシェアしたいと思います。

はじめての統計学