検出力曲線とサンプルサイズ

2025年8月8日

統計的検出力曲線がサンプルサイズによってどう変化するかを、数式とインタラクティブな可視化で学びます。

Hypothesis TestingStatistical PowerBeta ErrorSample Size

統計的検出力とは？

統計的検出力（power）とは、対立仮説が真であるときに、検定が帰無仮説を正しく棄却する確率のことです。つまり、実際に効果があるときにそれを検出できる可能性を表します。次の問いに答える指標です。

「本当に差があるなら、その差を検定で見つけられる確率はどれくらいか？」

検出力が高いほど、第II種過誤（偽陰性）のリスクは低くなります。検出力は次の4つに依存します。

有意水準 $\alpha$
効果量 $\delta = \mu_A - \mu_0$
母標準偏差 $\sigma$
サンプルサイズ $n$

この記事では、サンプルサイズ $n$ を増やすと検出力がどう改善し、検出力曲線がどう形を変えるかに焦点を当てます。

検出力関数：段階的な導出

以下の設定で片側 $Z$ 検定を考えます。

帰無仮説： $\mu = \mu_0$
対立仮説： $\mu > \mu_0$
標準偏差 $\sigma$ は既知
標本平均 $\bar{X} \sim \mathcal{N}(\mu, \sigma^2 / n)$

1. 検定統計量

標準化した検定統計量は次の通りです。

Z = \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}} \sim \mathcal{N}(0, 1) \quad \text{under } H_0

2. 棄却域

次を満たすとき、帰無仮説を棄却します。

Z > z_\alpha

ここで $z_\alpha$ は標準正規分布の上側 $\alpha$ 分位点で、

\mathbb{P}(Z > z_\alpha) = \alpha

を満たします。

対立仮説の下での非心分布

次に、対立仮説が真、すなわち $\mu = \mu_A$ とします。このとき

Z = \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}} = \frac{(\bar{X} - \mu_A) + (\mu_A - \mu_0)}{\sigma / \sqrt{n}} = \underbrace{\frac{\bar{X} - \mu_A}{\sigma / \sqrt{n}}}_{\sim \mathcal{N}(0, 1)} + \frac{\delta \sqrt{n}}{\sigma}

となるため、対立仮説の下では

Z \sim \mathcal{N}\left( \frac{\delta \sqrt{n}}{\sigma},\; 1 \right)

です。

この平均のシフト量は非心母数と呼ばれ、

\lambda = \frac{\delta \sqrt{n}}{\sigma}

で与えられます。これは、帰無仮説が偽のとき検定統計量が非心正規分布に従うことを示しています。

検出力関数

検出力は、この非心分布が棄却域に入る確率です。

\text{Power}(n) = \mathbb{P}(Z > z_\alpha \mid \mu = \mu_A) = 1 - \Phi\left(z_\alpha - \frac{\delta \sqrt{n}}{\sigma} \right)

ここで $\Phi(\cdot)$ は標準正規分布の累積分布関数です。

例：サンプルサイズで検出力はどう変わるか

次のパラメータを固定します。

効果量 $\delta = 0.5$
標準偏差 $\sigma = 1$
有意水準 $\alpha = 0.05$

このとき、異なる $n$ に対する検出力は次のようになります。

サンプルサイズ $n$	検出力
10	0.158
30	0.385
50	0.553
100	0.809

$n$ が増えると非心分布は右にシフトし、 $z_\alpha$ を上回る確率が高くなるため、検出力も高くなります。

まとめ

サンプルサイズ $n$ が大きくなるほど検出力は高くなる。
対立仮説の下では検定統計量が右にシフトし、 $H_0$ を棄却しやすくなる。
このシフトは非心母数 $\lambda = \frac{\delta \sqrt{n}}{\sigma}$ で表される。
検出力関数は、真の効果をどれだけ検出できるかを示す。
検出力曲線を可視化すると、適切なサンプルサイズ設計に役立つ。

Interactive Power Curve: Effect of Sample Size

Watch how the power curve changes as you adjust sample size

Sample Size (n): 50

10200

Significance Level (α): 0.05

0.010.10

Small Effect (δ=0.2)

0.409

Medium Effect (δ=0.5)

0.971

Large Effect (δ=0.8)

1.000

Power Curve (n = 50)

Hover over the dots to see power values for small, medium, and large effect sizes

Power Formula:

Power = 1 - Φ(z_α - δ√n/σ)

z_α = 1.645 (critical value)

n = 50 (sample size)

σ = 1 (standard deviation)

Where Φ is the standard normal CDF, δ is effect size, and λ = δ√n/σ is the noncentrality parameter

What to Observe:

• Steeper curve: As n increases, the power curve becomes steeper
• Leftward shift: Higher n detects smaller effect sizes with the same power
• 0.8 power benchmark: Notice the effect size needed to achieve 80% power
• Noncentrality grows with √n: The λ = δ√n/σ parameter increases with sample size