· 用語解説  · 4 min read

標準偏差と分散とは?データの「バラツキ」を知る物差し

平均点は同じでも、全員が平均に近いか、上下に激しく分かれているか?データの散らばり具合を数値化する統計の基礎を解説。

平均点は同じでも、全員が平均に近いか、上下に激しく分かれているか?データの散らばり具合を数値化する統計の基礎を解説。

3行まとめ

  • 分散 (Variance): データが平均からどれだけ離れているか(散らばっているか)の平均的な指標。差を2乗して計算する。
  • 標準偏差 (Standard Deviation): 分散の「正の平方根(√)」。元のデータと同じ単位でバラツキを表せるため、最もよく使われる。
  • 正規分布: データが左右対称に釣り鐘型に分布している状態。標準偏差を使うと「全体の約68%が平均±標準偏差に入る」などの予測ができます。

試験での出題ポイント

試験では、特に「標準偏差の意味」と「データの散らばり」が問われます。

  1. 標準偏差が大きい: データが平均から大きく散らばっている(バラバラの状態)。
  2. 標準偏差が小さい: データが平均の近くに集まっている(まとまっている状態)。
  3. 品質管理の例: 製品のサイズの標準偏差を小さくすることで、均一な品質(バラツキの少ない製品)を保つことができます。

【AIハック】生成AIで「テストの評価」を分析

標準偏差の感覚は、AIに「2つのクラスの成績比較」をさせることで理解が深まります。

プロンプト例:

「あなたは塾の先生です。AクラスもBクラスも、数学の平均点は70点でした。しかし、Aクラスの 標準偏差 は5、Bクラスは20です。それぞれのクラスの データの散らばり 具合と、どのような指導が必要か、 分散 という言葉を交えて説明してください。」

AIが「平均付近に密集しているAクラス(分散が小さい)」と「得意な人と苦手な人の差が激しいBクラス(分散が大きい)」という対比を解説してくれるため、バラツキの数値的な実感が伴います。

まとめ:データの「密度」を読み取ろう

平均値だけでは見えないデータの断面を、標準偏差や分散を使うことで鮮明に捉えることができます。

試験では、 散らばりが大きい=標準偏差(分散)が大きい という基本関係をしっかりと覚えておきましょう。

Back to Blog

Related Posts

View All Posts »