PR

「データの活用」とは?代表値・範囲・外れ値の基本をわかりやすく解説

中学数学

中学生になって、文字式の計算の知識や図形の新しい計算など、様々な計算問題を行ってきました。

このサイトでは、上記の学習内容の解説も行い、その中で日常生活で利活用できる知識も紹介してきました。

ですが、これを読んでいる学生さんにはいまいちピンとこない内容もあったと思います。

学生のうちに勉強している内容は、社会に出て実際に活用する場面に遭遇した時、始めて学習したことが活きている、活かせていると実感できるので、学生のうちではどうしても想像の域を超えていくのは難しいかと思います。

ですが、今回勉強していく「データの活用」については、もちろん学習内容として勉強はしていきますが、学生さんの日常生活の中でも十分に活かせる知識である内容で、かつ既に知っているという人もいなくもない内容です。

それぐらい「データの活用」の単元は身近な内容であるので、もし数学の勉強に対して苦手意識がある学生さんはこの単元から知識をつけていくことをおすすめします。

 

データの活用はなぜ大切なのか?日常生活と数学のつながりを実感しよう

では、早速データの活用の学習内容を見ていきますが、その前に、この単元がどれくらい日常生活に近い内容なのかをお話しておきます。

改めてですが、中学校の数学では、計算問題や図形の問題と並んで「データの活用」という分野があります。

この分野は他の学習単元に比べて、私たちが日々の生活の中で自然と使っている考え方に近いものが多い単元です。

たとえば、友達とのテストの点数の話題、スポーツの成績、テレビの視聴率、アンケート調査の結果など、どれも「データ」が関わっているものばかりです。

こうした身近なデータを見たり比較したりする際に、「平均値」や「中央値」「範囲」「最頻値」などの考え方が役立ちます。

このような場面は普段の生活の中では無意識でも行っていることでもあるので、この分野は日常生活に近い部分で活かせる内容になっています。

 

データの活用とは?現代社会での重要性と学ぶ意味

では、もう少し深く「データの活用」を見ていきましょう。

「データの活用」と聞くと、具体的にはどういうこと?と少しイメージしづらい印象を受けるかもしれません。

しかし、これは「集めた情報(数値)を使って、物事をよりよく理解したり判断したりする力」を育てる学習です。

つまり、「情報を読み解く力」を鍛えることでもあります。

たとえば、こんな場面を思い浮かべてみてください。

  • 天気予報で「明日の最高気温は30℃です」と聞く。
  • お店で「この商品は先月より10%売上アップ」と書かれている。
  • 先生が「このクラスの数学の平均点は75点です」と言う。

これらはすべて「データを活用した情報」です。

そして、正しくデータを読み取ることができれば、判断を誤らず、効率よく行動を選ぶことができます。

中学校の数学では、次のような力をつけることが「データの活用」のねらいです。

  • データを集める
  • 集めたデータを整理する
  • データの中心やばらつきを代表値や範囲として数値化する
  • 得られた情報を分析・判断に活かす

この分野の学習は、単にテストのためだけでなく、身につけた知識を将来的に社会に出たときにも役立つ実用的なスキルとしていくことも目的になります。

 

データを整理する第一歩:表とグラフで見やすくまとめる

データの活用の学習の目的について、しっかりと説明したところで、少しずつ学習内容に入っていきたいと思います。

実際にデータを活用するには、まず「整理」することが欠かせません。

たとえば、クラスの生徒に「好きなスポーツ」を聞いたとします。

以下のようなデータが集まったとしましょう。

名前 好きなスポーツ
Aくん サッカー
Bさん バスケ
Cさん サッカー
Dくん 野球
Eさん サッカー

これをそのまま眺めても、全体の傾向はつかみにくいです。

そこで、同じ種類ごとにまとめた表(度数分布表)やグラフにすることで、視覚的に理解しやすくなります。

たとえば、「サッカー:3人、バスケ:1人、野球:1人」とまとめて円グラフにすれば、一目で「サッカーが一番人気」ということがわかります。

このように、「整理して視覚化する」ことで、データの特徴や傾向がはっきりと見えるようになります。

次の内容では、整理したデータを使って代表値を求めていきます。

 

データの中心を表す「代表値」って何?

データを整理する目的が見えてきたところで、次に整理したデータにおける代表値と呼ばれるものを見ていきます。

代表値とは、たくさんあるデータの「特徴」や「中心的な傾向」を、たった1つの数字で表すための方法です。

中学数学では、主に以下の4つの代表値を学びます。

平均値

1つ目は「平均値」です。

平均値は、すべてのデータの合計を、データの個数で割った値のことです。

もっとも基本的な代表値であり、算数のときから馴染みがある人も多い値です。

計算方法

データが$a_1, a_2, …, a_n$ のとき、
平均値=$\frac{a_1+a_2+…+a_n}{n}$

テストの点数が 70点, 80点, 90点, 60点, 100点 の5人の場合
合計=400点 → 平均値=$\frac{400}{5}=80$

注意点
平均値は便利ですが、「極端な値(外れ値)」があるとその影響を受けやすいという特徴があります。(後述します。)

中央値(メジアン)

2つ目は「中央値」です。

中央値とは、データを大きさの順に並べたとき、真ん中にくる値です。

求め方

  1. データを昇順(または降順)に並べる。
  2. データ数が奇数なら中央の値、偶数なら中央2つの平均をとる。

中央値は2つの場合があるので、それぞれについて例を見ていきます。

例1(奇数個)

60点, 70点, 80点, 90点, 100点 → 中央の「80点」が中央値になります。

例2(偶数個)

60点, 70点, 80点, 90点 → $\frac{70+80}{2}=75$が中央値になります。

特徴
中央値は、外れ値の影響を受けにくいため、偏りのあるデータでも中心的な値をうまく表せます

最頻値(モード)

3つ目は「最頻値」です。

最頻値は読んで字のごとく、もっともよく出てくる値のことです。

英語では「モード」とも呼ばれます。

データ:60, 70, 80, 80, 90 → 最頻値=80(2回出てくる)

注意点

  • 最頻値が複数あることもあります(例:60, 60, 80, 80 → 60と80の両方)。
  • すべての値が1回だけなら、最頻値は存在しないと考えることもあります。

最頻値を活用する例は、商品の売れ筋、よく出る選択肢、人気の傾向などを知りたいときに有効です。

調整平均とは?

平均値については、注意点で示したように、外れ値と呼ばれるデータがあるときにそのデータの影響を受けやすいという特徴があります。

そのため、「調整平均」と呼ばれる値があります。

調整平均とは、極端な値(外れ値)を除いて計算する平均値です。

中学では必ずしも習わない用語ですが、実生活では使われる場面も多くあります。

例:

データ:50点, 60点, 70点, 80点, 100点
→ 最小の50点と最大の100点を除いて、60点, 70点, 80点 の平均を求める。
→ $\frac{60+70+80}{3}=70$が調整平均になります。

調整平均を使う利点は、外れ値の影響を減らすことができ、実態に近い傾向を捉えやすいという点です。

 

代表値だけではわからない?「データのばらつき」に注目

ここまでの説明では、平均値・中央値・最頻値などの代表値を使って「データの中心」を知る方法を説明してきました。

しかし、代表値が同じでも、データの性質はまったく異なる場合があります。

例えば、以下の2つのデータを見てください。

  • データA:70, 75, 80, 85, 90 → 平均値80
  • データB:50, 60, 80, 100, 110 → 平均値80

どちらも平均値は同じ「80」ですが、Aの方が数値がまとまっていて、Bは大きくバラバラです。

このようなデータの広がりやバラつきの程度を「散らばり」と呼び、範囲や外れ値などを使って分析します。

ここからは、データの範囲や散らばりについて解説を進めていきます。

 

データの範囲(レンジ)とは?広がりを数字でとらえる

まずはデータの範囲について解説を行っていきます。

範囲とは何か?

先ほどの2つの例のように、データはいつでもまとまった範囲のデータが得られるとは限りません。

そのために、データの散らばりを見るための基本的な指標が「範囲(レンジ)」です。

範囲とは、最大値から最小値を引いた差のことで、「データの広がり」を表します。

計算式

範囲=最大値 −最小値

この計算式を実際に使って範囲の計算を行ってみましょう。

例題

データ:65, 68, 70, 72, 75
最大値:75、最小値:65
範囲=75−65=10

このように、範囲を見れば「どのくらい値が離れているか」がひと目で分かります。

平均だけで判断すると気づかないことも、範囲を見ればすぐにわかるのです。

範囲の使いどころ

データの範囲はどのようなデータでも使うことはできますが、より効果的に使える場面は下記のとおりです。

  • テストの点数のバラつきを見るとき
  • スポーツの記録が安定しているかを見るとき
  • 複数のデータを比較して、「安定しているもの」を選びたいとき

注意点

データの範囲はどんなデータにも使えますが、注意点はもちろんあります。

範囲は、1つの外れ値によって大きく左右される可能性があります。

そのため、データの全体像を判断するときは、他の指標とあわせて見ることが効果的です。

 

最大値と最小値:範囲を構成する2つの柱

ここで、範囲の計算式で出てきた最大値と最小値について見ていきます。

範囲を理解するためには、最大値と最小値についてもしっかり押さえておく必要があります。

最大値

まずは「最大値」から見ていきます。

最大値はデータの中で最も大きな数値のことです。

70, 82, 60, 85, 78 → 最大値=85

最小値

続いて「最小値」です。

最小値はデータの中で最も小さな数値のことです。

70, 82, 60, 85, 78 → 最小値=60

この2つがわかれば、範囲はすぐに求められます。

 

外れ値とは?見つけ方と注意すべき点

では、ここで先ほどまで何度も出てきている「外れ値」について、解説を行っていきます。

外れ値の理解は、データの活用の単元を理解するうえでは、非常に重要になるので、しっかりと理解をしていきましょう。

外れ値とは?

外れ値とは、他のデータと比べて極端に大きい(または小さい)値のことです。

この外れ値があると、代表値や範囲に大きな影響を与えることがあります。

外れ値の具体例を下記で見ていきます。

例:外れ値による影響

2つのデータAとBを見てください。

データA:60, 62, 63, 65, 68 → 平均 = 63.6
データB:60, 62, 63, 65, 100 → 平均 = 70

データBのほうは、1つの極端な値(100)があるだけで、平均値が大きくズレてしまうのがわかります。

この例でみたように、極端な値が他の代表値に影響を及ぼすことを認識しておきましょう。

外れ値の対処法

外れ値は他の代表値に影響を及ぼしてしまうので、可能な限り影響を及ぼさない方法でデータを整理していきます。

では、外れ値があるときは、どのようにすればいいでしょうか?

結論、外れ値がある場合は、以下のような工夫をすることをおすすめします。

方法 内容
中央値を使う 中央値は外れ値に強い(影響されにくい)
調整平均を使う 外れ値を除いて平均を出す
外れ値の原因を調べる 測定ミスや記録ミスでないかを確認する

 

代表値はどう使い分ける?目的別に選ぶ考え方

ここまでの説明で、様々な代表値を学んできました。

様々学んできましたが、平均値・中央値・最頻値・範囲などの統計的な用語は、単に暗記するだけでは意味がありません。

大切なのは、「いつ、どの値を使うべきか」を理解し、正しく使い分ける力です。

それぞれの代表値について、使い分けるときを詳しく見ていきましょう。

1.平均値を使うべきとき

平均値を使うときは下記のようなときです。

  • データが全体的にバランスよく分布しているとき
  • 明確な外れ値がないとき
  • 全体の「総合的な傾向」を見たいとき

クラス全体のテストの平均点
→「全体的な学力傾向」を知るには平均が適しています。

2.中央値を使うべきとき

中央値を使うときは下記のようなときです。

  • 外れ値がある場合(=平均が引っ張られる)
  • 「だいたい真ん中の人がどのくらいか」を知りたいとき
  • データの偏りを避けて中心を把握したいとき

年収データ、マンション価格の中央値
→一部の高額者が平均を上げすぎている可能性があるため中央値が適しています。

3.最頻値を使うべきとき

最頻値を使うときは下記のようなときです。

  • よく出てくる値(=モード)に意味があるとき
  • 人気・流行を知りたいとき
  • 購買行動・選択肢の傾向を見たいとき

人気のTシャツサイズ、売れ筋の色
→「一番多く選ばれている」という視点が重要になります。

4.範囲や散らばりを使うとき

最後に範囲や散らばりを使うときは下記のようなときです。

  • 成績や能力の「安定性」や「ばらつき」を確認したいとき
  • グループごとの比較をしたいとき(例:テストの差)
  • 外れ値が含まれるときに注意点を把握するため

 

代表値や範囲を使った実生活の例

ここまでは学習した内容は、テストや試験の対策としての解説でしたが、ここからは日常生活において利活用できる例について見ていきます。

家庭での例

まずは家庭での実用例を見ていきます。

  • 子どもの成績表を見て、「平均点」では良さそうに見えるが、範囲が広い(数学100点、英語50点)なら、実際には苦手科目がある可能性があります。
  • 月ごとの電気代の中央値と範囲を見れば、光熱費がどの月に高くなりやすいかがわかります。

ビジネスでの例

次にビジネスでの活用例です。

  • 顧客満足度アンケートで、平均点は高いが最頻値が低い場合、「多くの人はあまり満足していない可能性」があります。
  • 売上の平均が高くても、範囲が広い場合は不安定なビジネスになっていることがあります。

スポーツでの例

最後にスポーツでの活用例を見ていきます。

  • 選手の得点平均が高くても、範囲が広ければ「ムラがある選手」と判断される可能性もあります。
  • 逆に、平均点がそこまで高くなくても、範囲が狭く安定している選手はチームにとって重要であると判断できる可能性もあります。

 

よくある試験問題のパターンと考え方

改めて、学習内容に戻って、試験問題のパターンとその問題の考え方を見ていきます。

パターン1:代表値を求める問題

例題

次のデータの平均値、中央値、最頻値を求めなさい。
データ:62, 75, 80, 80, 90

解答

  • 平均値 = (62+75+80+80+90) ÷ 5 = 77.4
  • 中央値 = 中央の80(データを小さい順に並べて中央)
  • 最頻値 = 80(2回出ている)

パターン2:範囲と散らばりの問題

例題

データAとデータBの平均は同じだが、どちらが安定しているかを判断しなさい。
A:70, 75, 80, 85, 90
B:50, 60, 80, 100, 110

解説

どちらのデータが安定しているかを判断するため、範囲の計算をしていきます。

解答

A:70, 75, 80, 85, 90 → 範囲20
B:50, 60, 80, 100, 110 → 範囲60

平均は同じでも、範囲が狭いAの方が安定していると判断できる。

 

よくある誤解とその回避

データの活用に関しては、誤解されやすいポイントも多いため、最後にQ&A形式で確認していきます。

平均が高いなら問題ないのでは?
A. 平均だけでは判断できません。
平均を引き上げる外れ値の存在や、全体のばらつきを無視している可能性があります。
中央値や範囲も確認しましょう。
中央値が高ければ良い成績と言える?
A. 中央値は外れ値に影響されない分、安定的な値ですが、「上位層・下位層の情報」は見えません。
分布全体を見渡すには箱ひげ図が有効です。
最頻値が人気なら、常にそれを選べばよい?
A. 場合によります。
一時的な偏りや、選択肢の制限によって最頻値が生じることもあるため、理由や背景を分析することも重要です。
データの活用とは何ですか?
A. データの活用とは、数値情報を整理・分析し、その意味を読み取って判断に役立てる力を育てることです。
中学校では、代表値や散らばりの把握、グラフの読み取りを通じてその力を学びます。
最頻値とは何ですか?
A. 最頻値(モード)とは、最もよく出てくる数のことです。
人気や傾向を知るときに役立ちます。たとえば、「このクラスで一番多かった身長は150cmだった」など。
中央値や範囲はどう使い分ける?
A. 中央値は「データのちょうど真ん中の値」、範囲は「最大と最小の差」です。
中央値は外れ値に強く、範囲は散らばりを見るのに便利。両方見ることでバランスが取れます。

 

まとめ

このページではデータの活用について、データの活用を学ぶ意義や代表値の基礎内容、日常生活などでの活用例などを見ていきました。

説明の中でもお話してきましたが、「データの活用」は、単に数学の単元にとどまりません。

自分で数字を読み解き、判断できるようになることが、この単元の大きな目標になります。

  • 平均だけを見るのではなく、中央値・最頻値・範囲なども活用する
  • 外れ値に注意しながら、正しく判断する
  • 日常の選択に「データを根拠として使う」視点を持つ

このページで学習したことは基本的なことばかりであるため、それぞれの代表値の意味や使いどころをしっかりと理解していくところから始めてみましょう。

この単元で得た知識と考え方は、学校のテストだけにとどまらず、将来の自分の判断力や行動力につながります。

コメント

タイトルとURLをコピーしました