条件付き確率分布、条件付き確率密度関数

2変数確率分布の時の条件付き確率分布をみていきましょう。
片方の確率変数の値が確定している時に、もう一つの確率変数の確率変数分布がどうなるかというのが条件付き確率です。

さて、条件付き確率分布の定義を見ていきましょう。確率変数が離散値の場合と連続値の場合に分けて定義します。ただし、二つとも本質的には同じことです。

離散確率変数の場合

一方の確率変数が[latex]Y=y[/latex]という値をとったという前提のもとで、もう一方の変数が[latex]X=x[/latex]という値をとる確率(条件付き確率分布)[latex]g(x|y)=P(X=x|Y=y)[/latex]は以下で与えられます。

[latex size=2]\displaystyle g(x|y)=\frac{f(x,y)}{h(y)}[/latex]

 

ここで、[latex]f(x,y)=P(X=x, Y=y)[/latex]は同時確率分布で、確率変数X,Yが同時に[latex]X=x[/latex]と[latex]Y=y[/latex]という値をとる確率です。また、分母の[latex]h(y)=P(Y=y)=\sum_x f(x,y)[/latex]は、周辺確率分布で確率変数[latex]X[/latex]の値は問わずに、とにかく確率変数[latex]Y[/latex]が[latex]Y=y[/latex]という値を取る確率です。

 

この式は次のように書き直すこともできます。

[latex size=2]\displaystyle P(X=x|Y=y)=\frac{P(X=x, Y=y)}{P(Y=y)}[/latex]

 

連続確率変数の場合

連続確率変数の時も同様に、[latex]Y=y[/latex]という値をとったという前提のもとで、もう一方の変数が[latex]X=x[/latex]という値をとる条件付き確率密度関数[latex]\displaystyle g(x|y)[/latex]を次のように定義します。

[latex size=2]\displaystyle g(x|y)=\frac{f(x,y)}{h(y)}[/latex]

 

ここで、[latex]f(x,y)[/latex]は、確率変数[latex]X,Y[/latex]の同時確率密度関数で、[latex]h(y)[/latex]は、確率変数[latex]Y[/latex]の周辺確率密度関数です。

離散確率変数と連続確率変数で条件付き確率分布は同じ式に見えますが、一方は確率に対する式で、もう一方は確率密度に対する式であることに注意してください。