検出力曲線とサンプルサイズ

統計的検出力曲線がサンプルサイズによってどう変化するかを、数式とインタラクティブな可視化で学びます。

Hypothesis TestingStatistical PowerBeta ErrorSample Size

統計的検出力とは?

統計的検出力(power)とは、対立仮説が真であるときに、検定が帰無仮説を正しく棄却する確率のことです。つまり、実際に効果があるときにそれを検出できる可能性を表します。次の問いに答える指標です。

「本当に差があるなら、その差を検定で見つけられる確率はどれくらいか?」

検出力が高いほど、第II種過誤(偽陰性)のリスクは低くなります。検出力は次の4つに依存します。

  • 有意水準 α\alpha
  • 効果量 δ=μAμ0\delta = \mu_A - \mu_0
  • 母標準偏差 σ\sigma
  • サンプルサイズ nn

この記事では、サンプルサイズ nn を増やすと検出力がどう改善し、検出力曲線がどう形を変えるかに焦点を当てます。


検出力関数:段階的な導出

以下の設定で片側 ZZ 検定を考えます。

  • 帰無仮説:μ=μ0\mu = \mu_0
  • 対立仮説:μ>μ0\mu > \mu_0
  • 標準偏差 σ\sigma は既知
  • 標本平均 XˉN(μ,σ2/n)\bar{X} \sim \mathcal{N}(\mu, \sigma^2 / n)

1. 検定統計量

標準化した検定統計量は次の通りです。

Z=Xˉμ0σ/nN(0,1)under H0Z = \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}} \sim \mathcal{N}(0, 1) \quad \text{under } H_0

2. 棄却域

次を満たすとき、帰無仮説を棄却します。

Z>zαZ > z_\alpha

ここで zαz_\alpha は標準正規分布の上側 α\alpha 分位点で、

P(Z>zα)=α\mathbb{P}(Z > z_\alpha) = \alpha

を満たします。


対立仮説の下での非心分布

次に、対立仮説が真、すなわち μ=μA\mu = \mu_A とします。このとき

Z=Xˉμ0σ/n=(XˉμA)+(μAμ0)σ/n=XˉμAσ/nN(0,1)+δnσZ = \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}} = \frac{(\bar{X} - \mu_A) + (\mu_A - \mu_0)}{\sigma / \sqrt{n}} = \underbrace{\frac{\bar{X} - \mu_A}{\sigma / \sqrt{n}}}_{\sim \mathcal{N}(0, 1)} + \frac{\delta \sqrt{n}}{\sigma}

となるため、対立仮説の下では

ZN(δnσ,  1)Z \sim \mathcal{N}\left( \frac{\delta \sqrt{n}}{\sigma},\; 1 \right)

です。

この平均のシフト量は非心母数と呼ばれ、

λ=δnσ\lambda = \frac{\delta \sqrt{n}}{\sigma}

で与えられます。これは、帰無仮説が偽のとき検定統計量が非心正規分布に従うことを示しています。


検出力関数

検出力は、この非心分布が棄却域に入る確率です。

Power(n)=P(Z>zαμ=μA)=1Φ(zαδnσ)\text{Power}(n) = \mathbb{P}(Z > z_\alpha \mid \mu = \mu_A) = 1 - \Phi\left(z_\alpha - \frac{\delta \sqrt{n}}{\sigma} \right)

ここで Φ()\Phi(\cdot) は標準正規分布の累積分布関数です。


例:サンプルサイズで検出力はどう変わるか

次のパラメータを固定します。

  • 効果量 δ=0.5\delta = 0.5
  • 標準偏差 σ=1\sigma = 1
  • 有意水準 α=0.05\alpha = 0.05

このとき、異なる nn に対する検出力は次のようになります。

サンプルサイズ nn検出力
100.158
300.385
500.553
1000.809

nn が増えると非心分布は右にシフトし、zαz_\alpha を上回る確率が高くなるため、検出力も高くなります。

まとめ

  • サンプルサイズ nn が大きくなるほど検出力は高くなる。
  • 対立仮説の下では検定統計量が右にシフトし、H0H_0 を棄却しやすくなる。
  • このシフトは非心母数 λ=δnσ\lambda = \frac{\delta \sqrt{n}}{\sigma} で表される。
  • 検出力関数は、真の効果をどれだけ検出できるかを示す。
  • 検出力曲線を可視化すると、適切なサンプルサイズ設計に役立つ。

Interactive Power Curve: Effect of Sample Size

Watch how the power curve changes as you adjust sample size

10200
0.010.10
Small Effect (δ=0.2)
0.409
Medium Effect (δ=0.5)
0.971
Large Effect (δ=0.8)
1.000

Power Curve (n = 50)

Hover over the dots to see power values for small, medium, and large effect sizes

Power Formula:

Power = 1 - Φ(zα - δ√n/σ)
zα = 1.645 (critical value)
n = 50 (sample size)
σ = 1 (standard deviation)
Where Φ is the standard normal CDF, δ is effect size, and λ = δ√n/σ is the noncentrality parameter

What to Observe:

  • Steeper curve: As n increases, the power curve becomes steeper
  • Leftward shift: Higher n detects smaller effect sizes with the same power
  • 0.8 power benchmark: Notice the effect size needed to achieve 80% power
  • Noncentrality grows with √n: The λ = δ√n/σ parameter increases with sample size
← 図鑑に戻る