周辺確率分布、周辺確率密度関数

2変数確率関数の同時確率分布(連続確率変数の場合は同時確率密度)から、周辺確率分布(連続確率変数の場合は周辺確率密度関数)と呼ばれる分布を得ることができます。

周辺確率分布(周辺確率密度関数)とは、2変数のうちの一方の変数の総和をとることによって、一方だけの変数の確率分布にしたものです。この周辺確率分布を、確率変数が離散の場合と、連続の場合のそれぞれについて分けて説明します。(両方ともほとんど同じように定義しますが、離散か連続かによって微妙な違いがあります。)

周辺確率分布(離散の場合)

2変数の離散確率変数[latex]X[/latex]と[latex]Y[/latex]の同時確率分布を[latex]f(x,y)=P(X=x, Y=y)[/latex]とします。この同時確率分布[latex]f(x,y)[/latex]は、2つの離散確率変数[latex]X[/latex]と[latex]Y[/latex]に対して、それぞれの確率変数が[latex]x[/latex]と[latex]y[/latex]という値をとる確率を表します。

この時、離散確率変数[latex]X[/latex]と[latex]Y[/latex]のそれぞれの周辺確率分布[latex]g(x)[/latex]と[latex]h(y)[/latex]を以下で定義します。

[latex size=2]\displaystyle g(x)=P(X=x)=\sum_y f(x,y)[/latex]

 

[latex size=2]\displaystyle h(y)=P(Y=y)=\sum_x f(x,y)[/latex]

周辺確率変数のことを英語で(marginal probability distribution)と言います。

周辺確率密度関数(連続の場合)

連続確率変数の場合もほとんど同じように定義できます。

2変数の連続確率変数[latex]X[/latex]と[latex]Y[/latex]の同時確率密度関数を[latex]f(x,y)[/latex]とします。(2つの連続確率変数[latex]X[/latex]と[latex]Y[/latex]があった時に、それぞれの確率変数が[latex]x\sim x+\Delta x[/latex]と[latex]y\sim y+\Delta y[/latex]の範囲に値をとる確率は[latex]P[x\le X \le x+\Delta x,y\le Y\le y+\Delta y]=f(x,y)\Delta x\Delta y[/latex]ですが、この式の左辺の[latex]f(x,y)[/latex]を同時確率密度関数と言います。)

すると、連続確率変数[latex]X[/latex]と[latex]Y[/latex]の周辺確率密度関数[latex]g(x)[/latex]と[latex]h(y)[/latex]を以下で定義します。

[latex size=2]\displaystyle g(x)=\int_{-\infty}^\infty f(x,y)dy[/latex]

 

[latex size=2]\displaystyle h(y)=\int_{-\infty}^\infty f(x,y)dx[/latex]

 

周辺確率密度関数のことを英語でmarginal probability density functionといいます。ここで、周辺確率密度関数自身は「確率」ではなくて、あくまで、「確率密度関数」です。確率密度関数[latex]f(x,y)dxdy[/latex]に厚み[latex]dx[/latex]と[latex]dy[/latex]をかけて初めて確率になることに注意してください。