四分位相について押えておきたいこと

四分位数に関して覚えておきたいワードが「第1四分位数」「第2四分位数」「第3四分位数」「四分位範囲」「四分位偏差」です。漢字が多く圧迫感がありますが、内容はとても簡単です。

それでは一つずつ見ていきましょう。

四分位数とは

そもそも四分位数とは何か?

何かのデータを4分割にして、境界の数値やどれくらいのバラツキがあるかなどを見て分析するものです。

第2四分位数とは?

第2四分位数とは、小さい順に並べて真ん中にくる値です。

イメージしやすいよう、具体例を見ていきましょう。

学校のあるクラスでテストをしました。生徒が9名で各点数が下記のとおりです。

Aさん 80点
Bさん 76点
Cさん 55点
Dさん 62点
Eさん 92点
Fさん 78点
Gさん 58点
Hさん 65点
Iさん 88点

 

これを小さい順に並べます。

このとき、真ん中にきた数「$76$」が第2四分位数です。中央値とも言います。

すべて76点だったら?

この場合も上と同じ位置です。小さい順に並べて真ん中にくる値が第2四分位数です。

生徒が10名の場合は?(偶数の場合)

生徒数が9名の場合、データ数は奇数で真ん中が存在しました。

では、生徒が10名の場合はどうでしょうか?Jさんが100点だったとしましょう。

そうすると、真ん中がありません

このようなときは、真ん中の2つの平均値が第2四分位数となります。つまり、$(76+78)\div2=77$が第2四分位数となります。

データ数によって求め方が変わる

まとめると、奇数の場合は真ん中の値、偶数の場合は真ん中の2つの値の平均値となります。

第1四分位数、第3四分位数とは?

引き続き先ほどの具体例で見ていきます。

まず、「第2四分位数」より小さい側のグループ大きい側のグループに分けます。

この小さい側のグループから第1四分位数、大きい側のグループから第3四分位数を求めることができます。

すべて76点だったら?

上の図と変わらず、小さい側のグループも大きい側のグループも個数は変わらず4個ずつで、すべての値が$76$です。小さい側のグループなので、第2四分位数と同じ値でも問題はないと思います。

第1四分位数

第1四分位数とは、第2四分位数より小さい側のグループの真ん中にくる値です。

先ほどの具体例で見ていきましょう。

第2四分位数と同様に真ん中の値をとりたいのですが、データ数が4個と偶数なので、真ん中の値がありません

このようなときは、真ん中の2つの平均値が第1四分位数となります。

小さい側のグループの真ん中の2つの平均値は、$(58+62)\div2=60$なので、第1四分位数は$60$です。

第3四分位数

※第1四分位数と同様です

第3四分位数とは、第2四分位数より大きい側のグループの真ん中にくる値です。

先ほどの具体例で見ていきましょう。

第2四分位数と同様に真ん中の値をとりたいのですが、データ数が4個と偶数なので、真ん中の値がありません

このようなときは、真ん中の2つの平均値が第3四分位数となります。

大きい側のグループの真ん中の2つの平均値は、$(80+88)\div2=84$なので、第3四分位数は$84$です。

四分位範囲とは?

四分位範囲は、「第3四分位数ー第1四分位数」の値のことです。

真ん中より小さい側のグループの中の真ん中の値と、真ん中より大きい側のグループの中の真ん中の値の差を見ることで、そのデータがどれくらいバラついているかを判断するために使えます。

こちらも具体例で見てみると、第1四分位数は$60$、第3四分位数は$84$なので、$84-60=16$。四分位範囲は、$16$となります。

四分位偏差とは?

四分位偏差は、四分位範囲を2で割った値のことです。

こちらも四分位範囲同様、そのデータがどれくらいバラついているかを判断するために使います。

なぜ2で割るのか?

正直はっきりとした理由は分かりませんでした。

個人的に思う理由ですが、第1四分位数と第3四分位数は25%、75%の位置と少し離れています。よって、その際にどちらか一方に少し大きめ(もしくは小さめ)の値がある場合に差である四分位範囲の値が大きくなってしまいます。

そういったことを考慮して、2で割っているのかな…?と思ったりしました。

正しい理由が見つかりましたら、追記します。

足して2で割るのならなんとなく理解はできそうですが…。(中央値の比較に使いやすい)

こちらも具体例で見てみると、四分位範囲は$16$なので、$16\div 2=8$。四分位偏差は、$8$となります。

スポンサーリンク

当ページの注釈
  1. 問題の解答例など解法は見ずに解いています。覚えていない部分は学習はしますが、直接問題の解き方は調べていません。
    よって、順当な解法かは分かりませんが、何か参考になれば幸いです
  2. なるべく細かく書くようにしています。不明点はコメントいただければ嬉しいです
  3. また、正解かどうかのチェックは行い、正解にはなっています

 

キーワード

気になる人は調べてみてね。

四分位数、第1四分位数、第2四分位数、第3四分位数、四分位範囲、四分位偏差、データ解析