PR
このページには広告が設置されています。

データの活用に関する基礎知識 ~平均値・中央値・最頻値・外れ値~

中学数学

中学数学では、計算問題や図形の問題以外にも、日常生活で活かせる場面が多い「データの活用」の分野の学習も詳しく取り組んでいきます。

データの活用の分野も他の学習分野と同様に、中学の3年間に加えて、高校生でも学習が継続する分野ですが、上記でも説明したように、日常生活でも利用する場面が多く、この分野をきっかけに数学を得意になれることもしばしばあります。

このページでは、そんなデータの活用の範囲から、まずは基本の用語の解説を中心にお話を進めていきたいと思います。

【PR】オンライン数学塾 数強塾

数学が苦手な学生に特におすすめ!オンラインの数学専門塾。中学生から高校生まで数学の勉強法から、受験対策まで1対1で丁寧にサポート!

 

【PR】UniLink

受験生登録数10万人以上!受験に関する様々な悩みや相談を現役の難関大学生が回答してくれる。受験生必見のアプリ。

 

データの活用とは何か

データの活用とは何か

用語の解説を行っていく前に、データの活用とはどういったことかを説明していきたいと思います。

現代社会において、私たちは日常生活のさまざまな場面で「データ」と呼ばれる数値や情報に触れています。

例えば、天気予報の気温、スポーツの試合結果、テストの点数、商品の売上など、身の回りには多くのデータが存在しています。これらのデータを適切に整理し、分析することで、物事の傾向を把握したり、より良い判断を下したりすることが可能となります。

中学校数学における「データの活用」は、データを集めて整理し、特徴を捉え、意味のある情報として活用するための基本的な方法を学ぶ分野です。

この分野では、データの代表値や散らばりを表す値について理解し、実際の問題に応用できる力を身につけることが目標となっています。

データの活用では、まずデータを「整理」することから始まります。

例えば、アンケート調査で集めた多数の数値データを、表やグラフにまとめることで、全体の傾向や特徴が見やすくなります。

次に、整理したデータから「代表値」や「散らばり」を表す値を求め、データの特徴を数値的に把握します。これにより、データの中心や広がり、特別な値(外れ値)などを客観的に分析することができます。

 

代表値の種類と求め方

代表値の種類と求め方

データの活用について説明したところで、少しずつ用語の解説へと移っていきたいと思います。

データの特徴を一つの数値で表す方法として、「代表値」と呼ばれる値があります。

代表値にはいくつかの種類があり、それぞれ異なる特徴を持っています。代表値を理解し、適切に使い分けることは、データの活用において非常に重要です。

1. 平均値(へいきんち)

まず1つ目は「平均値」です。

平均値とは、データ全体の合計をデータの個数で割った値です。

最も基本的な代表値であり、データ全体の「中心的な値」としてよく用いられます。

平均値は算数でも学習した値なので、どういった値かイメージはしやすいものだと思います。

計算方法

データが$a_1,a_2,a_3,…,a_n$の$n$個あるとき、平均値は次の式で求めます。

平均値=$\frac{a_1+a_2+a_3+…+a_n}{n}$

5人の生徒のテストの点数が70点、80点、90点、60点、100点だった場合、

平均値=$\frac{70+80+90+60+100}{5}=\frac{400}{5}=80$

となります。

平均値はデータ全体の傾向を把握するのに便利ですが、極端に大きい値や小さい値(外れ値)があると、その影響を強く受けてしまうという特徴があります。

2. 中央値(ちゅうおうち、メジアン)

2つ目の値は「中央値」です。

中央値とは、データを大きさの順に並べたとき、ちょうど真ん中にくる値のことです。データの個数が奇数の場合は中央の値、偶数の場合は中央の2つの値の平均を中央値とします。

また、英語では「メジアン:median」といいます。

求め方

  1. データを小さい順(昇順)または大きい順(降順)に並べる。
  2. 個数が奇数の場合:中央の値が中央値。
  3. 個数が偶数の場合:中央の2つの値の平均が中央値。

データが 60点、70点、80点、90点、100点 の場合、中央の80点が中央値です。
データが 60点、70点、80点、90点 の場合、中央の2つ(70点と80点)の平均、すなわち

$\frac{70+80}{2}=75$

が中央値となります。

中央値は、外れ値の影響を受けにくいという特徴があり、特にデータに極端な値が含まれている場合に、データの中心を示す値として有効です。

3. 最頻値(さいひんち、モード)

3つ目の値は「最頻値」です。

最頻値とは、データの中で最も多く現れる値のことです。

英語では「モード:mode」とも呼ばれます。

データが 60点、70点、80点、80点、90点 の場合、80点が最も多く現れているので、最頻値は80点です。

最頻値は、データの中で「最もよく見られる値」を示すため、商品の売れ筋や人気の傾向を把握する際などに役立ちます。

ただし、最頻値が複数ある場合や、すべての値が1回ずつしか現れない場合もあります。

4. 調整平均(ちょうせいへいきん)

4つ目は「調整平均」です。

この値はあまり中学数学では出てこない値ですが、知っておくと便利な値でもあるので解説します。

調整平均とは、データの中から極端に大きい値や小さい値(外れ値)を除いてから平均値を求める方法です。

これにより、外れ値の影響を減らし、より実態に近い平均値を得ることができます。

データが 50点、60点、70点、80点、100点 の場合、最小値の50点と最大値の100点を除いた 60点、70点、80点 の平均を求めます。

$\frac{60+70+80}{3}=\frac{210}{3}=70$

このように、調整平均は外れ値の影響を避けたいときに有効な代表値です。

改訂版 中学校3年間の数学が1冊でしっかりわかる本
中学で習う数学を短時間で総復習! 15万部のロングセラーとなった『中学校3年間の数学が1冊でしっかりわかる本』が、2021年度からの新学習指導要領にあわせてリニューアル! 基礎から学び直したい社会人にも大人気です。 最少の時間で最大限に理解...
中学校3年間の数学が1冊でしっかりわかる問題集
15万部のロングセラー『中学校3年間の数学が1冊でしっかりわかる本』の問題集版が、ついに登場! ていねいな解説に加え、実力を伸ばせる演習問題が満載です。 取り外せる別冊解答つき。 最少の時間で最大限に理解できるように、中学数学の大切なことだ...

 

データの散らばりを表す値

データの散らばりを表す値

ここまでデータの代表値について解説していきましたが、ここからは代表値以外の値を解説していきます。

代表値以外の値を学習する理由は、データの特徴を把握する際、代表値だけでは不十分な場合があるからです。

たとえば、平均値が同じでも、データのばらつき(散らばり)が大きく異なることがあるためです。

そのため、データがどの程度広がっているか、またはまとまっているかを示す値を考えることが重要です。

1. 最大値と最小値

まずは「最大値」「最小値」です。

最大値とは、データの中で最も大きい値を指します。

最小値とは、データの中で最も小さい値を指します。

これらの値についても算数の中で学習してきている値なので、特に深い解説は不要かと思いますが、数学での学習においては、最大値と最小値は、データの範囲や外れ値を把握するうえで基本となる数値ということは理解しておきましょう。

データが 65点、70点、75点、80点、95点 の場合、最大値は95点、最小値は65点です。

2. 範囲(はんい)

2つ目に「範囲」です。

範囲とは、データの最大値と最小値の差を指します。

範囲は、データがどのくらい広がっているかを簡単に知ることができる指標です。

範囲=$最大値-最小値$

最大値が95点、最小値が65点の場合、

範囲$=95-65=30$

となります。

範囲は計算が簡単で直感的に理解しやすいですが、極端な値(外れ値)がある場合には、その影響を大きく受けるという特徴があります。

3. データの散らばりを考える意義

これらの代表値以外の値を解説したところで、これらの値を考える考える意義について説明していきます。

結論から言えば、データの散らばりを表す値を知ることで、同じ平均値を持つ異なるデータの性質を比較できるようになります。

たとえば、平均点が同じ2つのクラスがあったとしても、一方は点数がばらばらで、もう一方はほとんど同じ点数だった場合、学習の定着度や指導方法を考えるうえで重要な手がかりとなります。

上記の例で考えると、平均点が80点だったとしても、一方のクラスの点数の最大値が95点、最小値が60点(これで範囲が35点)であり、もう一方のクラスの点数の最大値が100点、最小値が40点(これで範囲が60点)だった場合、クラス単位で学習の定着度を考えると、前者のほうがより学習が定着していると考えられます。

このようにデータをより多角的に分析できるようにするためにも、代表値以外の値を知ることには意義があります。

 

外れ値とデータの特徴

外れ値とデータの特徴

さて、ここまで学習をしてきた中で、ところどころに「外れ値」という言葉が出てきていました。

ここでは、その外れ値とは何かを解説していきます。

データの中には、他の値と大きくかけ離れた値が含まれることがあります。

このような値を「外れ値(はずれち)」と呼びます。

外れ値は、データ全体の傾向を把握する際に注意が必要な存在です。

1. 外れ値とは

外れ値とは、他の多くのデータと比べて極端に大きい、または小さい値を指します。

外れ値が存在することで、平均値や範囲などの代表値に大きな影響を与えることがあります。

データが 60点、62点、63点、65点、95点 の場合、95点は他の値と比べて極端に大きいため、外れ値と考えられます。

2. 外れ値への対応

外れ値がある場合、データの分析や代表値の選択に注意が必要です。

たとえば、平均値は外れ値の影響を受けやすいため、中央値や調整平均を用いることで、より実態に近い値を得ることができます。

また、外れ値がなぜ生じたのか、その原因を考えることも重要です。

記録ミスや特別な事情がある場合には、データの修正や除外を検討することもあります。

3. 代表値の選択と外れ値

このページではデータの活用の中でも基本的な代表値などについて解説してきましたが、言葉やその算出方法を覚えるだけではこの分野では不十分です。

つまり、代表値はデータの特徴や目的に応じて使い分けることが大切です。

たとえば、外れ値がある場合は中央値や調整平均を、データの傾向や人気を知りたい場合は最頻値を、全体の平均的な状況を知りたい場合は平均値を用いるとよいでしょう。

改訂版 中学校3年間の数学が1冊でしっかりわかる本
中学で習う数学を短時間で総復習! 15万部のロングセラーとなった『中学校3年間の数学が1冊でしっかりわかる本』が、2021年度からの新学習指導要領にあわせてリニューアル! 基礎から学び直したい社会人にも大人気です。 最少の時間で最大限に理解...
中学校3年間の数学が1冊でしっかりわかる問題集
15万部のロングセラー『中学校3年間の数学が1冊でしっかりわかる本』の問題集版が、ついに登場! ていねいな解説に加え、実力を伸ばせる演習問題が満載です。 取り外せる別冊解答つき。 最少の時間で最大限に理解できるように、中学数学の大切なことだ...

 

まとめ

このページでは、中学1年生で学習する「データの活用」の基本的な値や考え方について解説しました。

データを整理し、代表値(平均値、中央値、最頻値、調整平均)や範囲、最大値・最小値、外れ値といった数値を求めることで、データの中心や広がり、特徴を客観的に把握することができます。

代表値は、データの特徴を一つの数値で表す便利な指標ですが、データの性質や目的によって適切に使い分けることが重要です。また、データの散らばりや外れ値にも注意を払い、偏りや特異な値が分析に与える影響を考慮することが求められます。

データの活用は、数学だけでなく、社会や理科、日常生活のさまざまな場面でも役立つ重要なスキルです。今後、より複雑なデータやグラフ、統計の学習に進むうえでも、このページで学んだ基礎的な考え方をしっかりと身につけるようにしていきましょう。

数強塾

数強塾は、中学生〜高校生を対象に数学の苦手をサポートするオンライン塾です。

プロの講師1対1で指導にあたるので、理解できるまで丁寧に指導しています。

学校の授業の復習や定期テストの勉強から、受験対策まで自分のレベルにあった学習が家庭にいながらできるのも魅力の1つ。

  • 学校の授業の理解が追いついていない人
  • 定期テストの点数をあげたい人
  • なかなか数学で点数が取れない人
  • 受験対策として数学を重点的に学習したい人
対象 回数 入塾金 科目
中学1年〜高校3年 週1日〜週3日  あり(初月のみ)
16,500円(税込)
数学

コメント

タイトルとURLをコピーしました