同時確率分布

多変数の確率変数を扱おうとすると、多次元の確率分布という概念が必要になります。ここではます、2次元の確率分布について説明していきます。多変数の確率変数を扱う上で中心となる概念が、同時確率分布(または同時確率密度関数)です。

確率変数が離散の場合と連続の場合で、この概念の言い方が若干違いますが、本質的には同じものです。確率変数が離散の場合は「同時確率分布」といい、連続の場合は「同時確率密度関数」といいます。

離散確率分布の場合

2つの離散確率変数[latex]X[/latex]と[latex]Y[/latex]があった時に、それぞれの確率変数が[latex]x[/latex]と[latex]y[/latex]という値をとる確率を同時確率分布(joint probability distribution)といい、次のように書きます。

[latex size=2]\displaystyle P(X=x, Y=y)=f(x,y)[/latex]

 

この式の左辺は、確率変数[latex]X[/latex]と[latex]Y[/latex]が、それぞれ[latex]x[/latex]と[latex]y[/latex]という値をとる確率をあらわしています。それを右辺にある[latex]f(x,y)[/latex]と表します。

ここで、確率の総和は1となるので、次が成り立つことに注意します。

[latex size=2]\displaystyle \sum_{x}\sum_{y}f(x,y)=1[/latex]

 
この式は、確率の保存(規格化)を表しています。つまりすべての起こり得る場合の確率を全部足すと1になるので、それを表しています。

連続確率分布の場合

確率変数が連続の場合もほとんど同じです。ただキーワードが「確率」ではなくて「確率密度」となっているところに注意してください。

2つの連続確率変数[latex]X[/latex]と[latex]Y[/latex]があった時に、それぞれの確率変数が[latex]x\sim x+\Delta x[/latex]と[latex]y\sim y+\Delta y[/latex]の範囲に値をとる確率は以下で与えられます。

[latex size=2]\displaystyle P(x\le X \le x+\Delta x,y\le Y\le y+\Delta y)=f(x,y)\Delta x\Delta y[/latex]

 

ここで、[latex]f(x,y)[/latex]を同時確率密度関数(joint probability density function)といいます。ここで、密度関数といっているのは、[latex]f(x,y)[/latex]自身は確率ではないからです。[latex]f(x,y)dxdy[/latex]に厚み[latex]dx[/latex]と[latex]dy[/latex]をかけて初めて確率になることに注意してください。

ここで、確率の総和は1となるので、次が成り立つことに注意しましょう。

[latex size=2]\displaystyle \int_{x}\int_{y}f(x,y)dxdy=1[/latex]