確率分布と確率密度関数
ラプラスとコルモゴロフの確率の定義をふまえ、確率分布と確率密度関数(PDF)の基礎をやさしく解説します。
前回の記事では、ラプラスとコルモゴロフによる確率の定義を紹介しました。
今回は、その次のステップとして確率分布と**確率密度関数(PDF)**を見ていきます。
確率変数と確率分布
まずは確率変数の考え方を押さえます。
確率変数 とは、ランダムな実験の結果に数値を対応づけるものです。
- 例:サイコロを1回振る → を出た目とする()
- 例:区間 [0,1] に針を落とす → を落ちた位置とする()
確率分布は、「 がどんな値を取り、それぞれがどれくらいの確率で起こるか」を表します。
いわば、確率の全体像を示す地図です。
離散の場合(例:サイコロ)
サイコロを1回振ると、起こりうる結果は です。
を出た目と定義すると、確率分布は次のようになります。
表にすると次の通りです。
| 結果 | 1 | 2 | 3 | 4 | 5 | 6 |
|---|---|---|---|---|---|---|
| 確率 | 1/6 | 1/6 | 1/6 | 1/6 | 1/6 | 1/6 |
このような離散的な分布は、**確率質量関数(PMF)**で記述します。
連続の場合(例:区間 [0,1] に針を落とす)
次に、0 から 1 cm の線分上にランダムに針を落とすことを考えます。
を落ちた位置とすると、 はいくつでしょうか。
実は、ちょうど 0.5 cm に落ちる確率は 0 です。
連続分布では、1点ではなく区間に対して確率を考えます。
ここで使うのが**確率密度関数(PDF)**です。
たとえば [0,1] 上の一様分布では、密度は
となり、確率は曲線下の面積(積分)で求めます。
つまり、確率は区間上の密度を積分した値です。
離散分布と連続分布の違い
| 観点 | 離散分布(PMF) | 連続分布(PDF) |
|---|---|---|
| 扱う対象 | 個々の値 | 区間 |
| 1点の確率 | に意味がある | |
| 計算方法 | 和を取る | 積分する |
まとめ
- 確率変数 は、ランダムな結果を数値で表す
- 確率分布 は、 の値とその起こりやすさを示す
- PMF は離散の場合(サイコロ・コインなど)を扱う
- PDF は連続の場合(長さ・位置など)を扱う
- 連続分布の確率は「密度曲線の下の面積」として求める
Probability Distributions and Densities
Interactive demonstration of discrete and continuous probability distributions
Discrete Distribution (Die Roll PMF)
PMF Property: Each individual outcome has a specific probability.
P(X = 3) = 1/6 ≈ 0.167
Key Concepts
Discrete Distribution (PMF)
• Each outcome has a specific probability
• Sum of all probabilities = 1
• P(X = specific value) ≠ 0
Continuous Distribution (PDF)
• Probability = area under the curve
• Total area under PDF = 1
• P(X = specific value) = 0
Mathematical Notes
Discrete: P(X = k) gives exact probability for outcome k
Continuous: P(a ≤ X ≤ b) = ∫ab f(x)dx
Key insight: For continuous distributions, probability is measured as area, not height!