PR

データを正しく理解するための「度数分布表」と「ヒストグラム」の基礎

中学数学

前回のページまでで、度数分布表を使ったデータの整理と分析の方法について解説していきました。

データを表にまとめていくことで、無機質なデータも意味を持つようになっていきますが、データを表にまとめた後によりそのデータから分かることはないか、検討するために利用できるのが「グラフ」にすることです。

そして、前回学習した度数分布表と最も相性のいいグラフは「ヒストグラム」になります。

ヒストグラムは算数の学習では出てきたこともなく、これまで作成してきたことも少ないかと思います。

なので、このコラムでは、「ヒストグラムってなに?」「どうやって作るの?」「気をつけることはあるの?」という疑問を、1つずつ丁寧に説明していきます。

グラフを使ってデータを読み取れるようになると、テストの成績だけでなく、スポーツの記録やアンケート結果など、身のまわりのさまざまなことがもっとよくわかるようになります。

ヒストグラムの学習に入る前に、度数分布表についてまだ理解が十分でないと感じる人は下記のページで改めて復習した後にこのページに戻ってきてみましょう。

度数分布表から読み解く!平均値・中央値・最頻値の求め方と活用法
度数分布表の作り方から、平均値・中央値・最頻値の求め方まで、統計の基礎を丁寧に解説。階級値や階級幅の意味、ヒストグラムとの関係、データの特徴の読み取り方まで幅広く網羅。初心者にもわかりやすい具体例付きで、基礎固めをしていきたい方にもおすすめです。
相対度数と累積相対度数の求め方完全ガイド|日常生活での活用例も紹介
相対度数・累積相対度数の意味や求め方を、中学生の学習範囲で分かるように丁寧に解説。度数分布表を使った計算例やグラフ化の方法、統計的確率との関係まで網羅。テスト結果や売上分析、スポーツデータなど身近な事例を交え、データを読み解く力を養えるページです。

 

度数分布とは何か

まず、「度数分布」という言葉の意味から整理しましょう。

度数分布とは、データをいくつかの範囲(階級)に分け、それぞれに含まれるデータの数(度数)をまとめたものを指します。

生データがバラバラに並んでいる状態から、一定の幅ごとのまとまりに整理することで、データの特徴を見やすくします。

例:テストの点数を度数分布にする

たとえば、30人のクラスで国語のテストを行い、その点数を集めたとします。

点数が1点刻みで並んでいると「平均は?」「多い点数は?」などを読み取るのが大変です。

そこで、「40〜50点」「50〜60点」「60〜70点」… のように一定の幅で区切り、その範囲に入る人数を数えます。

これが度数分布です。

こうすると、

  • どの点数帯に多くの人がいるか
  • 高得点・低得点の人数がどれくらいか

がすぐにわかります。

 

度数分布表とは

簡単に度数分布とは何かを解説したところで、いよいよ度数分布表について解説を進めていきます。

早速結論ですが、度数分布表とは、度数分布を表にまとめたものになります。

度数分布表の構成

度数分布表には以下の列が含まれることが多いです。

  1. 階級(例:40〜50点)
  2. 度数(その階級に含まれるデータの数)
  3. 相対度数(全体に対する割合)
  4. 累積度数(その階級までの合計人数)

学校の授業では主に「階級」と「度数」を使いますが、統計やデータ分析では相対度数・累積度数も重要です。

なので、上記の4つは重要事項だと考えてしっかりと覚えていきましょう。

 

度数の求め方

4つの重要な用語のうち、度数は度数分布表を作成するうえで基本になるので、度数の求め方を見ていきます。

度数の求め方は非常にシンプルです。

  1. データ全体を眺めて、階級幅(グループの区切り方)を決めます。
  2. 各階級に入るデータの数を数えます。

注意点

度数を設定する際に注意することがあるので、その点も見ておきます。

  • 階級幅は必ずそろえる(例:すべて10点ごと)
  • 境目の値は「上の階級」に含める(例:60点は「60〜70点」に入れる)

これは、統計の世界での共通ルールであり、誤解や混乱を防ぐために大切です。

 

ヒストグラムとは

度数分布表ができたら、それを視覚化する方法の一つがヒストグラムです。

ヒストグラムは「柱のような棒グラフ」で、階級ごとの度数を棒の高さで表すグラフです。

ただし、通常の棒グラフとは違い、棒と棒の間にすき間を作らず、連続して描くのが特徴です。

なぜ間を空けないのかというと、点数や身長、体重などのデータは「連続的」に変化するため、階級同士も連続していると考えるからです。

 

棒グラフとの違い

先ほど、棒グラフとヒストグラムには違う点があるとお話しましたが、それぞれのグラフの違いを見ていきます。

結論として、棒グラフとヒストグラムは似ていますが、目的が違います。

  • 棒グラフ:種類ごとの大きさや割合を比較(例:好きな果物ランキング)
  • ヒストグラム:数値データの分布やかたよりを分析(例:テストの点数分布)

この違いを理解しておくと、グラフを選ぶときの迷いが減ります。

 

ヒストグラムからわかること

ヒストグラムを見ると、データの特徴が直感的にわかります。

たとえば

  • どの階級が一番多いか(山の位置)
  • データが広がっているか、集中しているか(ばらつき)
  • 上側・下側へのかたより(偏り)

このように、ヒストグラムは単に数を数えるだけでは見えにくい「全体像」をつかむのに役立ちます。

 

日常生活や社会での活用例

ヒストグラムや度数分布表は、授業だけでなく多くの分野で利用されています。

  • スポーツ:選手の記録の分布を分析
  • ビジネス:顧客年齢層や購買額の分布を把握
  • 医療:健康診断データの傾向分析
  • 学校:テスト結果の傾向や学習の成果の可視化

たとえば、学校でのテスト成績をヒストグラムにすると、クラス全体の学力分布が一目でわかり、補習が必要な生徒や特に成績が高い生徒を把握しやすくなります。

 

度数分布表を作る手順

ここからは、実際にデータを整理して度数分布表を作る具体的な流れを見ていきます。

例題を交えて説明するので、実際に自分でも解き進めると理解が深まります。

ステップ1:データを集める

まずは元になるデータ(生データ)を用意します。

例として、次のような数学のテスト結果(30人分)を使います。

45, 68, 72, 56, 81, 64, 59, 77, 92, 88,53, 69, 74, 62, 71, 85, 79, 68, 66, 94,58, 63, 60, 70, 75, 83, 80, 55, 67, 73

ステップ2:階級幅を決める

階級幅は、データの最小値と最大値を参考に決めます。

  • 最小値:45
  • 最大値:94

今回は幅を10点ごとにします。

階級は次のようになります。

  • 40〜50点
  • 50〜60点
  • 60〜70点
  • 70〜80点
  • 80〜90点
  • 90〜100点

ステップ3:度数を数える

各階級に含まれる人数を数えます。

境界の数値は「上の階級」に入れるルールを守ります。

例:60点は「60〜70点」に入れる。

ステップ4:表にまとめる

度数分布表を作ると以下のようになります。

階級(点) 度数(人) 相対度数(%) 累積度数(人)
40〜50 1 3.3 1
50〜60 5 16.7 6
60〜70 9 30.0 15
70〜80 7 23.3 22
80〜90 5 16.7 27
90〜100 3 10.0 30

相対度数は次の式で求めます。

相対度数(%)$=\frac{その階級の人数}{全体の人数}×100$

累積度数は、上から順に人数を足していくだけです。

 

度数の求め方(練習問題)

では練習です。

次のデータを、階級幅5で度数分布表にしてみましょう。

12, 17, 21, 25, 19, 22, 28, 24, 15, 20,18, 26, 23, 29, 16

解き方の流れ

先ほど解説した流れで解いていきます。

  1. 最小値:12、最大値:29
  2. 幅5の階級を設定
    • 10〜15
    • 15〜20
    • 20〜25
    • 25〜30
  3. 境界値は「上の階級」に入れる
  4. 各階級の人数を数える

練習では自分で紙に書き出してみると理解が深まります。

 

ヒストグラムの描き方

度数分布表ができたら、次はヒストグラムを作ります。

ヒストグラムの作成手順は下記のとおりです。

ヒストグラム作成の手順

  1. 横軸に階級(点数の範囲)を取る
  2. 縦軸に度数(人数)を取る
  3. 各階級に対応する高さの棒を描く
  4. 棒と棒の間は空けない

 

ヒストグラムの読み取り方

ヒストグラムの作成手順が分かったところで、ヒストグラムから読み取れることを見ていきます。

ヒストグラムはただ描くだけでなく、分析して初めて意味があります。

以下の観点で読み取ると深い分析ができます。

  1. 最頻階級
    • 度数が最も多い階級
    • この例では60〜70点
  2. 分布の広がり
    • 全体の階級幅が狭ければ成績がそろっている
    • 広ければばらつきが大きい
  3. かたよりの方向
    • 高得点側に尾が伸びている → 右にかたより
    • 低得点側に尾が伸びている → 左にかたより
  4. 山の数
    • 山が1つ → 単峰型(テストの成績などに多い)
    • 山が2つ以上 → 複峰型(異なるグループが混ざっている可能性)

 

度数分布表・ヒストグラムの応用活用法

ここまでの説明は数学の学習内容の解説でした。

ですが、度数分布表とヒストグラムは、単なる統計の授業だけでなく、日常生活や仕事、研究など幅広い分野で使えます。

ここでは具体的な活用例を紹介します。

1.学校教育での活用

  • 成績分析:定期テストの結果を分析し、補習対象者や学力層別指導に役立てる。
  • 体力測定:握力や50m走のタイム分布を比較し、クラス全体の体力傾向を把握する。
  • アンケート集計:生徒の学習時間や読書冊数の分布を見える化する。

2.企業での活用

  • 品質管理:製品の寸法や重量のばらつきを分析し、不良品を減らす。
  • 顧客分析:年齢層や購入金額の分布を可視化して、販売戦略を立てる。
  • 業務改善:作業時間や処理件数の分布を把握して効率化の糸口を探る。

3.日常生活での活用

  • 家計簿の支出金額をヒストグラムにして、どの範囲に集中しているか把握する。
  • 運動記録(ランニングの距離や時間)の分布を分析し、トレーニング計画を立てる。
  • 体重や睡眠時間の分布を見て生活習慣を改善する。

このように見ていくと、データの分析の学習単元であるため、様々なシーンや業種でここで学習している知識は活用できるということが分かります。

 

作成時の注意点とよくある間違い

度数分布表やヒストグラムが将来の様々なシーンでも使えるということが分かったので、これらを作成する際の注意点を押さえておきます。

ヒストグラムや度数分布表は、正しい方法で作らないと誤解を招く結果になります。

以下の注意点を押さえておきましょう。

1.階級幅を揃える

階級幅がバラバラだと、棒の高さが比較できなくなります。

必ず等間隔に設定しましょう。

2.境界値のルールを守る

境界値は「上の階級」に入れるのが一般的です。
例:70点は70〜80点に入れる

3.棒と棒の間を空けない

棒グラフと違い、ヒストグラムは連続したデータを表すため、棒の間を空けないのが基本です。

4.データの偏りを正しく解釈する

例えば、山が右に寄っているからといって「みんな成績が悪い」とは限りません。

データの意味を文脈に沿って判断する必要があります。

5.サンプル数が少なすぎないか確認

データ数が極端に少ない場合、分布が正確に反映されないことがあります。

最低でも20件以上のデータが望ましいです。

 

まとめ

このぺーじでは、ヒストグラムとはどういったグラフなのか、ヒストグラムの書き方や注意点などを解説していきました。

改めてになりますが、ヒストグラムは、データの広がりやかたまり、かたよりを見つけるのにとても便利なグラフです。

最初はこれまで学習してきたグラフと違う部分も多く、少しむずかしく感じるかもしれませんが、度数分布表を作って、グラフを描く手順を何回か練習すれば、きっとすぐに慣れてくるはずです。

またヒストグラムは数学だけでなく、理科や社会、総合学習などでもデータをまとめる場面でも活用することができます。

そんなとき、すらすらとヒストグラムをデータをまとめれば、みんながすぐに情報を読み取れる、わかりやすい資料を作ることができます。

ぜひ、自分でもいろいろなデータを使ってヒストグラムを作ってみる経験をまずはしてみましょう。

 

コメント

タイトルとURLをコピーしました