周辺確率分布、周辺確率密度関数

Pocket

2変数確率関数の同時確率分布(連続確率変数の場合は同時確率密度)から、周辺確率分布(連続確率変数の場合は周辺確率密度関数)と呼ばれる分布を得ることができます。

周辺確率分布(周辺確率密度関数)とは、2変数のうちの一方の変数の総和をとることによって、一方だけの変数の確率分布にしたものです。この周辺確率分布を、確率変数が離散の場合と、連続の場合のそれぞれについて分けて説明します。(両方ともほとんど同じように定義しますが、離散か連続かによって微妙な違いがあります。)

周辺確率分布(離散の場合)

2変数の離散確率変数XYの同時確率分布をf(x,y)=P(X=x, Y=y)とします。この同時確率分布f(x,y)は、2つの離散確率変数XYに対して、それぞれの確率変数がxyという値をとる確率を表します。

この時、離散確率変数XYのそれぞれの周辺確率分布g(x)h(y)を以下で定義します。

\displaystyle g(x)=P(X=x)=\sum_y f(x,y)

 

\displaystyle h(y)=P(Y=y)=\sum_x f(x,y)

周辺確率変数のことを英語で(marginal probability distribution)と言います。

周辺確率密度関数(連続の場合)

連続確率変数の場合もほとんど同じように定義できます。

2変数の連続確率変数XYの同時確率密度関数をf(x,y)とします。(2つの連続確率変数XYがあった時に、それぞれの確率変数がx\sim x+\Delta xy\sim y+\Delta yの範囲に値をとる確率はP[x\le X \le x+\Delta x,y\le Y\le y+\Delta y]=f(x,y)\Delta x\Delta yですが、この式の左辺のf(x,y)を同時確率密度関数と言います。)

すると、連続確率変数XYの周辺確率密度関数g(x)h(y)を以下で定義します。

\displaystyle g(x)=\int_{-\infty}^\infty f(x,y)dy

 

\displaystyle h(y)=\int_{-\infty}^\infty f(x,y)dx

 

周辺確率密度関数のことを英語でmarginal probability density functionといいます。ここで、周辺確率密度関数自身は「確率」ではなくて、あくまで、「確率密度関数」です。確率密度関数f(x,y)dxdyに厚みdxdyをかけて初めて確率になることに注意してください。

コメントは停止中です。