平均、中央値、最頻値の理解
平均、中央値、最頻値の基礎を明確な例と棒グラフの可視化で学びましょう。
BeginnerMeanMedianMode
平均、中央値、最頻値の理解
統計を勉強するとき、必ず出てくる3つの重要な概念:平均、中央値、最頻値。
これらはすべて「中心傾向」の尺度ですが、それぞれ異なる意味と計算方法を持っています。
この記事では以下を扱います:
- 平均、中央値、最頻値の定義と計算
- それらの違い
- 外れ値がある場合の動作
何が異なるのかを探っていきましょう!
1. 平均(Mean)
平均は最もよく使われる中心傾向の尺度です。
すべてのデータ値を合計し、値の個数で割って計算します:
例:データが の場合、
棒グラフでは、平均は棒の中央付近に落ちることが多い垂直線として表示されます。
2. 中央値(Median)
中央値は、データを順序に並べたときの「真ん中の値」です。
計算はデータ点の個数が奇数か偶数かによって異なります:
- 奇数の場合:一つの真ん中の値
- 偶数の場合:真ん中の2つの値の平均
例1:データ (5個、奇数)→ 中央値 =
例2:データ (6個、偶数)→ 中央値 =
棒グラフでは、中央値はデータセットを2つの半分に分割する垂直線として表示されます。
3. 最頻値(Mode)
最頻値は最も頻繁に現れる値です。
棒グラフでは最も高い棒に対応します。
例: の場合、
最も高い棒は 4 にあるので、最頻値 = 4。
4. 違いを示す例
データセット を考えてみましょう:
- 平均 =
- 中央値 = 2(真ん中の値)
- 最頻値 = 2(最も頻繁な値)
棒グラフでは:
- 最頻値は2の位置の最も高い棒として明確に表れます。
- 中央値は分布の中央にあります。
- 平均は外れ値(100)のために右に大きくずれています。
これは、平均が歪んだデータでは誤解を招く可能性があることを示しており、中央値と最頻値はより代表的なままです。
5. まとめ
- 平均:全体的なバランスには良いが、外れ値に敏感。
- 中央値:外れ値に対してより頑健。
- 最頻値:最も一般的な値を特定するのに有用。
インタラクティブデモ
以下のツールには3つのプリセットデータセットが含まれています:
- プリセット1:等間隔データ →
[2, 4, 6, 8, 10] - プリセット2:外れ値あり →
[1, 2, 2, 2, 100] - プリセット3:強い最頻値 →
[2, 2, 3, 4, 4, 4, 5]
それらを切り替えて、平均、中央値、最頻値がどのように動作するかを見てみましょう。
結果は棒グラフに表示され、違いを簡単に見つけることができます。
慣れたら、自分のデータセットを入力してみてください!
インタラクティブ平均・中央値・最頻値デモ
現在のデータセット: [2, 4, 6, 8, 10]
頻度棒グラフ
平均(平均値)
6.00
全ての値の合計 ÷ 値の個数
グラフ上の赤い破線
中央値(真ん中)
6
順序に並べた時の真ん中の値
グラフ上の青い実線
最頻値(最も頻繁)
最頻値なし
最も頻繁に現れる値
グラフ上の緑の棒
グラフ要素:
通常の頻度棒
最頻値の棒(最も頻繁)
平均(赤い破線)
中央値(青い実線)
重要な観察事項:
- • プリセット1: 均等に分布したデータでは全ての尺度が近い値を示します
- • プリセット2: 外れ値(50)が平均を右に引っ張りますが、中央値は主要データの中心にとどまります
- • プリセット3: 最頻値(4)は最も高い緑の棒として明確に見えます
- • 棒の間隔: 値間の実際の数値距離を示します
- • 緑のハイライト: 最頻値を一目で特定できるようにします