ガンマ分布
ガンマ分布の定義・特別な場合・医療統計での応用・加法性による直感を、やさしく解説します。
Probability DistributionsGamma DistributionChi-square DistributionIntermediate
ガンマ分布とは?
ガンマ分布は、ある回数の事象が起こるまでの合計待ち時間を表す連続確率分布です。
統計学の中でも応用範囲が広く、
指数分布やカイ二乗分布はガンマ分布の特別な場合として扱えます。
医学・生物統計での利用例
✅ 指数分布(ガンマ分布で α=1)
- 放射線治療:最初のがん細胞が破壊されるまでの時間
- 救急外来の到着過程:次の患者が到着するまでの時間
これは、最初の1回の事象が起こるまでの時間を表します。
✅ ガンマ分布(整数 α=n)
- ワクチン応答時間:複数回投与後に免疫応答が出るまでの総時間
- 多段階治療の所要時間:治療の複数フェーズが完了するまでの時間
これは、n 回目の事象が起こるまでの時間を表します。
✅ カイ二乗分布(ガンマ分布で α=k/2,β=1/2)
- 臨床試験:治療群と対照群の差の検定(χ2検定など)
- 遺伝子関連解析:疾患と遺伝子の関連の有意性検定
これは、独立な正規変数の**二乗和(ばらつきの総量)**を表します。
確率密度関数
ガンマ分布の確率密度関数は次で定義されます。
f(x;α,β)=Γ(α)βαxα−1e−βx,x>0
- α>0:形状母数(shape parameter)
- β>0:率母数(rate parameter)
- Γ(α):ガンマ関数(整数 n に対して Γ(n)=(n−1)!)
α と β の値によって、分布の形は大きく変わります。
ガンマ分布の特別な場合
指数分布:α=1
f(x;1,β)=βe−βx
最初の1回の事象が起こるまでの時間を表します。
カイ二乗分布:α=2k,β=21
χk2∼Gamma(2k,21)
これは、標準正規変数の二乗和に対応します。
ガンマ分布を可視化する
Interactive Gamma Distribution Explorer
Explore how shape (α) and rate (β) parameters affect the gamma distribution
Current Distribution: Gamma Distribution
Statistics
Mean: 2.000
Variance: 2.000
Std Dev: 1.414
Quick Examples
Distribution Visualization
Probability Density Function
f(x; α, β) = (βα / Γ(α)) × xα-1 × e-βx
Current: f(x; 2, 1)
上のインタラクティブツールで、
形状母数 α と率母数 β を変えたときの分布の変化を確認できます。
クイックボタンで次も表示できます。
- 指数分布(α=1)
- カイ二乗分布(α=k/2,β=1/2)
加法性:直感の核心
形状母数 α は、何回目の事象まで待つかという意味を持ちます。
指数分布の和はガンマ分布になる
独立な Xi∼Exp(β) に対して、
i=1∑nXi∼Gamma(n,β)
つまり、n 回目の事象までの待ち時間はガンマ分布に従います。
母関数(MGF)による確認
X∼Exp(β) の MGF は
MX(t)=E[etX]=β−tβ,t<β
したがって、和 Sn=∑Xi の MGF は
MSn(t)=(β−tβ)n
これは Gamma(n,β) の MGF
MGamma(n,β)(t)=(β−tβ)n
と一致します。よって、指数分布の和はガンマ分布です。
平均・分散とその直感
ガンマ分布を「指数待ち時間の和」として捉えると、
α と β が平均やばらつきにどう効くかが見えてきます。
📌 平均と分散
X∼Gamma(α,β)(rate 形式)なら
E[X]=βα,Var(X)=β2α
- α:待つ事象の回数
- β:単位時間あたりの発生の速さ
🔄 スケーリングと β の役割
変数変換で分散式の意味を確認できます。
Y∼Gamma(α,1) として
X=β1Y
と置くと、これは時間軸を β 倍の速さで測ることに対応します。
ヤコビアンを使うと
fX(x)=fY(βx)⋅dxd(βx)=fY(βx)⋅β
ここで
fY(y)=Γ(α)1yα−1e−y
より
fX(x)=Γ(α)βαxα−1e−βx
となり、たしかに Gamma(α,β) の密度になります。
また、一般に X=cY なら
Var(X)=c2Var(Y)
なので
Var(X)=(β1)2α=β2α
です。
🎯 なぜ分散は β2 に反比例するのか?
- α が大きい:待つ回数が増える → 合計時間もばらつきも増える
- β が大きい:事象が速く起こる → 待ち時間は短く、より安定する
ここで重要なのは、
- 平均は「長さ」なので時間に一次で比例
- 分散は「二乗単位の広がり」なので時間スケールの二乗で効く
そのため、速度を2倍(β→2β)にすると、
平均は1/2、分散は1/4になります。
まとめ
- ガンマ分布は「複数事象が起こるまでの合計待ち時間」を表す
- 指数分布とカイ二乗分布を特別な場合として含む
- 医療統計では、治療時間のモデリングや検定理論で広く使われる
- 加法性により、形状母数 α の直感(何回目まで待つか)が明確になる
- 分散が β2 に反比例することで、事象発生が速いほど不確実性が急速に小さくなることが分かる