第一種過誤・第二種過誤・検出力
正規分布の図を使って、第一種過誤(α)、第二種過誤(β)、検出力の意味を直感的に学びます。
Hypothesis TestingStatistical PowerAlpha ErrorBeta Error
はじめに
仮説検定では、次の3つの概念が重要です。
- 第一種過誤(Type I error, α)
- 第二種過誤(Type II error, β)
- 検出力(Power)
定義だけで覚えるより、グラフ上で面積として見ると理解しやすくなります。この記事では、正規分布とインタラクティブな可視化を使って、
- 仮説検定の基本
- α過誤・β過誤の意味
- 検出力の意味
- それぞれが曲線下面積とどう対応するか
を確認します。
設定:正規平均に対する片側検定
平均に対する単純な検定を考えます。
- 帰無仮説():
- 対立仮説(): (右側検定)
検定統計量 は標準正規分布に従うとします。
第一種過誤:真の帰無仮説を棄却する誤り
第一種過誤(α)は、帰無仮説が真なのに棄却してしまう確率です。 のもとでの標準正規曲線の右側の裾に対応します。
ここで は、有意水準によって決まる臨界値です。
第二種過誤:偽の帰無仮説を棄却できない誤り
第二種過誤(β)は、帰無仮説が偽なのに棄却できない確率です(つまり実際には )。これは 分布の左側領域に対応します。
このとき分布は右にシフトしており、対立仮説の下で臨界値を評価している点が重要です。
検出力
検出力は、帰無仮説が偽のときに正しく棄却できる確率です。
つまり 分布の右側領域です。
可視化デモ
次のデモでは、、、臨界値 を調整しながら、α過誤・β過誤・検出力が2つの重なる正規曲線の面積としてどう表れるかを確認できます。
Interactive Alpha-Beta-Power Demonstration
α = 5.00%
Alpha Error (Type I)
P(reject H₀ | H₀ true)
P(reject H₀ | H₀ true)
β = 36.13%
Beta Error (Type II)
P(accept H₀ | H₁ true)
P(accept H₀ | H₁ true)
Power = 63.87%
Statistical Power
P(reject H₀ | H₁ true)
P(reject H₀ | H₁ true)
How to interpret this visualization:
- • The blue curve represents the null hypothesis (H₀: μ = 0)
- • The red curve represents the alternative hypothesis (H₁: μ = μ₁)
- • The dashed vertical line is the critical threshold z_α
- • Alpha error: Blue shaded area to the right of the threshold
- • Beta error: Red shaded area to the left of the threshold
- • Statistical power: Green shaded area to the right of the threshold
グラフの見方:
- 青い曲線:
- 赤い曲線:
- 縦線:臨界値
- 閾値より右の青の裾:α過誤
- 閾値より左の赤の面積:β過誤
- 閾値より右の赤の面積:検出力
まとめ
- α過誤:偽陽性( の右裾)
- β過誤:偽陰性( の左側)
- 検出力:真陽性率( の右側)
- 確率を読むときは、どの分布の下で計算しているかを常に確認しましょう。