確率分布と確率密度関数

ラプラスとコルモゴロフの確率の定義をふまえ、確率分布と確率密度関数(PDF)の基礎をやさしく解説します。

ProbabilityBeginnerProbability Distribution

前回の記事では、ラプラスとコルモゴロフによる確率の定義を紹介しました。
今回は、その次のステップとして確率分布と**確率密度関数(PDF)**を見ていきます。

確率変数と確率分布

まずは確率変数の考え方を押さえます。
確率変数 XX とは、ランダムな実験の結果に数値を対応づけるものです。

  • 例:サイコロを1回振る → XX を出た目とする(X{1,2,3,4,5,6}X \in \{1,2,3,4,5,6\}
  • 例:区間 [0,1] に針を落とす → XX を落ちた位置とする(X[0,1]X \in [0,1]

確率分布は、「XX がどんな値を取り、それぞれがどれくらいの確率で起こるか」を表します。
いわば、確率の全体像を示す地図です。

離散の場合(例:サイコロ)

サイコロを1回振ると、起こりうる結果は 1,2,3,4,5,61,2,3,4,5,6 です。
XX を出た目と定義すると、確率分布は次のようになります。

P(X=k)=16,k=1,2,3,4,5,6P(X = k) = \frac{1}{6}, \quad k = 1,2,3,4,5,6

表にすると次の通りです。

結果 kk123456
確率 P(X=k)P(X=k)1/61/61/61/61/61/6

このような離散的な分布は、**確率質量関数(PMF)**で記述します。

連続の場合(例:区間 [0,1] に針を落とす)

次に、0 から 1 cm の線分上にランダムに針を落とすことを考えます。
XX を落ちた位置とすると、P(X=0.5)P(X=0.5) はいくつでしょうか。

実は、ちょうど 0.5 cm に落ちる確率は 0 です。
連続分布では、1点ではなく区間に対して確率を考えます。

P(0X0.5)=0.5P(0 \leq X \leq 0.5) = 0.5

ここで使うのが**確率密度関数(PDF)**です。
たとえば [0,1] 上の一様分布では、密度は

f(x)=1,0x1f(x) = 1, \quad 0 \leq x \leq 1

となり、確率は曲線下の面積(積分)で求めます。

P(aXb)=abf(x)dxP(a \leq X \leq b) = \int_a^b f(x) \, dx

つまり、確率は区間上の密度を積分した値です。

離散分布と連続分布の違い

観点離散分布(PMF)連続分布(PDF)
扱う対象個々の値区間
1点の確率P(X=x)P(X=x) に意味があるP(X=x)=0P(X=x)=0
計算方法和を取る積分する

まとめ

  • 確率変数 XX は、ランダムな結果を数値で表す
  • 確率分布 は、XX の値とその起こりやすさを示す
  • PMF は離散の場合(サイコロ・コインなど)を扱う
  • PDF は連続の場合(長さ・位置など)を扱う
  • 連続分布の確率は「密度曲線の下の面積」として求める

Probability Distributions and Densities

Interactive demonstration of discrete and continuous probability distributions

Discrete Distribution (Die Roll PMF)

0.000.050.100.150.201/61/61/61/61/61/6123456Die OutcomeP(X = k)

PMF Property: Each individual outcome has a specific probability.
P(X = 3) = 1/6 ≈ 0.167

Key Concepts

Discrete Distribution (PMF)

• Each outcome has a specific probability
• Sum of all probabilities = 1
• P(X = specific value) ≠ 0

Continuous Distribution (PDF)

• Probability = area under the curve
• Total area under PDF = 1
• P(X = specific value) = 0

Mathematical Notes

Discrete: P(X = k) gives exact probability for outcome k

Continuous: P(a ≤ X ≤ b) = ∫ab f(x)dx

Key insight: For continuous distributions, probability is measured as area, not height!

← 図鑑に戻る