平均と比べると標準偏差って苦手な気持ちになりませんか?文字数や漢字の雰囲気のせいですかね…。
実はこの標準偏差、平均とそんなに大きな違いはありません。何だかんだテストに出たりもするので理解して覚えてしまいましょう。
平均と標準偏差の違い
平均と標準偏差の違いって実は少ないんです。
平均とは?
たとえば、3人がテストをして、70点、75点、80点のときの平均はいくらになりますか?
まず、合計点を出します。合計は$70+75+80=225$点になります。
次に、合計を人数で割ります。$225\div 3=75$点になります。これが平均点です。平らに均(なら)すという、字のままですね。
まとめると、「全員の点数の合計」を「人数」で「割った値」が平均点です。
標準偏差とは?
平均で使ったデータを使います。3人がテストをして、70点、75点、80点の標準偏差はいくらになるでしょう。
標準偏差の求め方にいく前に、まず間違いを恐れずに言葉で書いてみると、
標準偏差とは点数が平均からどれくらい散らばっているかの平均みたいなものです。
では、少しずつ順番に標準偏差を形作っていきたいと思います。
(1)平均からどれくらい散らばっているか
平均点は既に求めたとおり75点です。これからどれくらい離れているか、つまり各点数と平均点との差を表にしてみましょう。ちなみに平均点との差を偏差といいます。
点数 | 平均との差 |
---|---|
70点 | $70-75=-5$点 |
75点 | $75-75=0$点 |
80点 | $80-75=5$点 |
それぞれ$-5$点、$0$点、$5$点と散らばっていることが分かりましたが、問題があります。
標準偏差とは「点数が平均からどれくらい散らばっているかの平均みたいなもの」なので、$-5$点、$0$点、$5$を足してその平均を取りたい。ですが、$70$点と$80$点の平均との差は$5$と$-5$で足すと$0$になってしまいます。
本当はどちらも$5$点離れているので$5+5=10$となってほしい、差は正の数になってほしいわけです。つまり、ここでの問題点とは平均値より低い値の場合、差をとるとマイナスになってしまうという点です。
(2)二乗したものをたす
「平均値より低い値の場合、差をとるとマイナスになってしまう」という問題点を解決するために、平均との差を二乗します。
マイナスにしない方法として平均との差の絶対値をとるというのはダメだったんですかね?
どうやら、微分ができるなど他の点で絶対値より二乗した方が都合が良いみたいです。
ということで、平均で「全員の点数の合計」を出したように、「各点の平均との差の二乗の合計」を計算します。
$(-5)^2+0^2+5^2=25+25=50$
「全員の点数の合計」「各点の平均との差の二乗の合計」、この計算は平均と標準偏差よく似ていますね。点数と平均との差という違いと二乗しているかしていないかの違いです。
(3)合計を人数で割る
合計を人数で割る。これは平均値と全く同じですね。
$\displaystyle \frac{50}{3}$
分数の形のまま置いておきます。
(4)ルートをとる
最後に、(3)の値のルートをとります。なぜ、ルートか?というと、(2)で二乗したものを足したからです。
(2)では、平均との差を二乗したので、実際の平均との差よりも大きい値になってしまっています。例えば、実際の差は$5$なのに二乗しているため$25$で計算されています。
これでは、数値は実際より散らばってしまいます。よって、二乗したのだからルートで開きを元に戻そうということです。
従って、標準偏差$\displaystyle =\sqrt{\frac{50}{3}}=\frac{5\sqrt{2}}{\sqrt{3}}=\frac{5\sqrt{6}}{3}$
$\sqrt{6} \fallingdotseq 2.4494897 \cdots$なので、標準偏差は約$4.0825$です。だいたいデータは4くらい離れているということです。
エクセルの関数「STDEV.P」を使って標準偏差を計算した結果「$4.08248$」となりました。四捨五入すると、$4.0825$となるので上で計算した結果は問題なさそうです
標準偏差の公式
「標準偏差とは?」の(1)~(4)より、「全員の平均点との差を二乗した値の合計」を「人数」で「割った値」の「ルートをとった値」が標準偏差です。
$n$が人数、$x_k$が各点数、$\mu$が平均点とすると、下記式で表せます。
標準偏差$\displaystyle = \sqrt{\frac{1}{n} \sum_{k=1}^{n} (x_k – \mu)^2}$
平均との違い
標準偏差 | 「全員の平均点との差を二乗した値の合計」を「人数」で「割った値」の「ルートをとった値」 |
---|---|
平均 | 全員の点数の合計」を「人数」で「割った値」 |
見比べてみると、よく似ていますね。
「点数の平均」か「点数と平均との差の平均」の違いです。そこだけ覚えておけば、標準偏差も思い出しやすくなるかと思います。
標準偏差から分かること
標準偏差が大きいとは、データが散らばっていて、平均値から離れたところにもデータがあるということです。
標準偏差が小さいとは、データが散らばっておらず、平均値の周りに集まっているということです。
言葉だけだと分かりにくいので、次の記事で実際のデータと図を用いて特徴を見ていきたいと思います。
スポンサーリンク
- 問題の解答例など解法は見ずに解いています。覚えていない部分は学習はしますが、直接問題の解き方は調べていません。
よって、順当な解法かは分かりませんが、何か参考になれば幸いです - なるべく細かく書くようにしています。不明点はコメントいただければ嬉しいです
- また、正解かどうかのチェックは行い、正解にはなっています
キーワード
気になる人は調べてみてね。
標準偏差、平均値