統計学_#003 平均値は、本当に真ん中くらいなのか?

平均台 統計学

あき
あき

テストでは、平均点ってだいたい真ん中くらいのイメージで、何かの数値のデータをみると、基準を明確にしたり、具体的な数値にしたり・・・で平均値というのが使われているけど・・・

実際に示されている平均値って本当にだいたい真ん中くらいなのか!? 

平均にはトリックがあると言われています。

平均台

平均値について考えてみる

まずは、具体的に平均値をかんがえてみる。

ここに40個の数字がある。こちらのデータの平均値を考えてみる

数字40個羅列のイラスト

これらの数字を昇順で並び替えてみると・・・

1.2.2.2.2.2.2.3.4.4.4.4.5.5.5.5.5.5.5.6.6.6.6.6.6.6.6.6.6.6.7.7.7.7.7.8.8.9.9.11

となる。 

ヒストグラムで表すとこうなる。

ヒストグラム_間隔1

ヒストグラムのデータの間隔を1→2に変更すると次のようになる。

ヒストグラム_間隔2

ヒストグラムのデータの間隔を2→4に変更すると次のようになる。

ヒストグラム_間隔4

分かり易くグラフやヒストグラムで示す時には、図示する際の値の間隔の取り方にも注意が必要かもしれません。

ちなみに今回の40個の数値の平均は、5.325になり、図より想像する平均値と実際の平均値ではだいたい同じようなイメージがいだけます。


平均貯蓄額が1791万円だとぉ~

ここでは、具体的な数値を用いて平均値を算出してみたいとおもいます。

のデータから、2020年の貯蓄(二人以上の世帯)の状況をしらべてみた。

こちらは、総務省より既にまとめられてホームページにも掲載されているので、こちらのPDFデータでも確認できます。


10万人あたりの貯蓄状況をまとめてみると、こうなった。

貯蓄分布の表2020年度_10万人あたりの比_2人以上

こちらのデータをExcelでヒストグラムにすると、こうなった。

ヒストグラム_2020年度_貯蓄_2人以上_間隔考慮なし

ぱっと見ると、意外と、高所得者も多い!!

でも、総務省の出しているヒストグラムはこうしめされています。

貯蓄現在高階級別世帯分布2020_二人以上の世帯_総務省データより

これは、0~1000万円までは、100万円間隔、1000万円~2000万円は200万円間隔、2000~3000万円は500万円間隔・・・

と貯蓄額が高くなればなるほど、金額の間隔が広くなっているため、間隔を100万円ずつと考えると、総務省のヒストグラムと同じようになる。

それにしても、世帯(2人以上)の貯蓄額の平均値が1791万円とは・・・ 

日本のみなさん、結構お金持ちなんですね。

私が作ったヒストグラムでは、なんとなくこれくらいの金額かなぁ~っておもうが、

総務省のヒストグラムではそんな感じには見受けられない・・・何故か?

実際、1800万円を超える世帯は、24%を下回っている。

なので、世帯の平均貯蓄額である1791万円は、おおよそ

1800万円以上:25%、1800万円以下:75%であり、

今回の場合では、平均値は実態を示していないことがわかります。


貯蓄額の中央値でも、1061万円だとぉ~

ここで、総務省もヒストグラムで表しているのは、平均値の他にも、

中央値である。 2020年の総務省の貯蓄保有世帯の中央値は1061万円である。

中央値とはすべてのデータを大きい順(小さい順でも)に並べた時、中央にくる値のことである。

中央値は、極端なデータの値の影響を受けづらくなり、実際の状況を表すのに適しているといわれています。

あき
あき

   それにしても、中央値でも1061万円ですか。。。       

先はまだまだ遠い・・・・

残念がってる人

コメント