エクセルで簡単に『ヒストグラム』を作成する方法

今回はQC7つ道具のひとつ『ヒストグラム』についてです。

エクセルを利用して『ヒストグラム』を作成する手順までを解説していきます。

『ヒストグラム』とは?

『ヒストグラム』とは対象データを区間ごとに区切り、その区間ごとの数値のバラつきを棒グラフに似たグラフで表したものです。

『ヒストグラム』は、「QC7つ道具」のひとつで、商品やサービスの品質管理でよく使われる分析手法です。

度数分布表を分かりやすく視覚的に分かるようにグラフ化させたもので『度数分布図』や『柱状グラフ』とも呼ばれています。

『ヒストグラム』での分析の目的

『ヒストグラム』は、データの分布を視覚的に分かりやすく表現する強力なツールです。単に平均値を知るだけでなく、データの形状、集中度、外れ値などを分析し、より深い理解を得ることができます。

  • データの特徴を知る
  • 視覚的に見やすくする
  • プレゼンなどで活躍
  • 問題点が一目でわかる

『ヒストグラム』の見やすさをご覧ください

視覚的に見やすくなっていることが分かると思います。

とくに、プレゼンの場では『ヒストグラム』を使用することで初見の視聴者にとって非常に見やすく入り込みやすくなりますね!

 

『ヒストグラム』が使われる例

・テストの点数

◦ 点数の高い・低いグループの割合を把握
◦ 全体的な学力レベルと、上位・下位層の分布を分析
◦ 特定の点数帯に集中している原因を探る

・精密製品の厚み

◦ 製品が規格内に収まっているか確認
◦ 厚みのバラつきを分析し、製造工程の改善に役立てる
◦ 特定の厚みの製品が多い原因を特定

・年齢別の預金データ

◦ 各年齢層の預金額の分布を把握
◦ 顧客層ごとの預金傾向を分析し、マーケティング戦略に役立てる
◦ 将来の預金動向を予測

など、様々なデータ分析に活用できる強力なツールです。データの深い理解を得るために是非『ヒストグラム』を活用しましょう。

エクセルで『ヒストグラム』を簡単に作成する手順

①全体のデータを入力する

まずは『ヒストグラム』の元となる全データを入力します。

②『度数分布表』を作成する

『度数分布表』は、データを一定の幅の階級に分類し、各階級に属するデータの個数 (度数) をまとめた表です。

データが少ないので、自分で数えて作りました。

データが多くて数えるのが困難な場合は、エクセルの機能『Frequency関数』を活用して『度数分布表』を作成する方法もあります。

③『棒グラフ』を『ヒストグラム』に変化させる

エクセルに『ヒストグラム』を作るツールがありますが、階級の指定が難しいので『棒グラフ』を改造して『ヒストグラム』に変化させます。

手順1 棒グラフを作成

  • 【度数分布表を選択】→【挿入】→【おすすめグラフ】→【総合縦棒】→【OK】

棒グラフができました。

手順2 間隔の調整と枠線

ヒストグラムは、グラフ間の間隔がないものなので、要素の間隔を0%にします。

次に棒グラフの間隔を無くし、枠線をつけていきます

  • 【グラフを選択しオプションを表示】→【要素の間隔0%】
  • 【オプションのペイントアイコン】→【枠線あり】

手順3 テキストボックスで必要な文字を入力

  • 【挿入】→【テキストボックス】→【必要な文字を入力】で調整して完成です。

 

ヒストグラムの完成です!

『ヒストグラム』の6つの型と特徴

左右対称型

左右対称型は、『ヒストグラム』の代表的な形状です。

特徴

  • 中央値の数値が大きい
  • データの分布が平均値を中心に左右均等
  • 正規分布に従っている可能性が高い

平均値の割合が多く、バランスの良い割合なので正常なヒストグラムとして分析されることが多い形状です。

ふた山型

ふた山型は、頂点が二つ存在し中央値が低くなっています。異常な形状と言えるでしょう。

データ収集の方法が良くない場合や入力ミスなどが原因で『ふた山型』の形状になってしまいます。

原因

  • 中央値に誤ったデータが混入している
  • 異なる要因がまじりあっている
  • データの集計方法に問題がある

複数のデータが混ざっている場合、それぞれのデータの中央値が異なるために『ふた山型』になる可能性があります。

『ふた山型のヒストグラム』ができた場合は再度、データの入力ミスがないか、データの収集方法に問題はないかを確かめる必要があります。

歯抜け型

歯抜け型は、データにバラつきがあり、ガタガタな形状になっています。

データが特定の範囲に集中し、その他の範囲にデータがほとんど存在しない状態です。

原因

  • データ量が少ない
  • 区間幅が大きすぎる(小さすぎる)
  • データの性質

データ量が少なすぎないか。区間幅が大き(小さ)すぎないかを確認してください。
データの性質が原因の場合は、データの性質を理解し、解釈に反映させ分析成果にしましょう。

すそ引き型

すそ引き型は、頂点が偏り、すそを引きずったような形状です。『右すそ引き型』と『左すそ引き型』の2種類があります。※上のヒストグラムは右すそ引き型

原因

  • データに上限または下限がある
  • 極端な値が存在している
  • データの集計方法に問題がある

測定器に上限や下限があるなどの場合、『すそ引き型』になる場合があります。

極端な値が存在して一部の数値を押し上げている場合、その値の意味を確認する必要があります。

絶壁型

絶壁型は、頂点が極端に偏っていて崖のようになっている形状です。

原因

  • データに上限または下限がある
  • データの選別が行われている

測定器に上限または下限があるなどの場合、『絶壁型』になる可能性があります。

また、検品後などで特定の範囲のデータが意図的に除外されている場合も『絶壁型』になる可能性があります。

離れ小島型

離れ小島型は、データの大部分が中央に集中し、そこから離れた場所に小さな山が存在する形状です。他のデータとは明らかに異なる値のグループが存在することを示唆します。

原因

  • 測定誤差
  • 異常値
  • データの混入

測定器の誤作動や人為的ミスなどで、極端に大きな値や小さな値が稀に出現する場合や、データの大部分とは異なる性質を持つ異常値が存在する場合、『離れ小島型』になる可能性があります。

異なる集団のデータが混入している場合も『離れ小島型』になる可能性があります。

まとめ

『ヒストグラム』は「QC7つ道具」のひとつで、商品やサービスの品質管理でよく使われる分析手法です。
データの分布を視覚的に分かりやすく表現する強力なツールです。

『ヒストグラム』を使用する目的

  • データの特徴を知る
  • 視覚的に見やすくする
  • プレゼンなどで活躍
  • 問題点が一目でわかる

プレゼンの場では、『ヒストグラム』を使用することで初見の視聴者にとって見やすく、入り込みやすくなります。

エクセルを利用することで、『ヒストグラム』を簡単に作成することができるので、分析に役立ててみてください。

『ヒストグラム』には6つの型があります。
それぞれの型の特徴を理解し、データの特性をより深く理解しましょう!

左右対称型:データが平均値を中心に左右対称に分布している
ふた山型:データに複数の傾向がある
歯抜け型:データにバラつきがあり、特定の範囲に集中している
すそ引き型:データに偏りがある
絶壁型:データに強い偏りがある
離れ小島型:データの大部分と異なる値のグループが存在する

『ヒストグラム』の活用

『ヒストグラム』は以下のような様々な場面で活躍できます。

データの分布確認:データがどのような分布をしているのかを視覚的に確認
データの比較:異なるデータセットの分布を比較
異常値の検出:データの大部分と明らかに異なる値を見つける
仮説検証:データの分布に基づいて仮説を検証
品質管理:製造工程における品質管理
マーケティング:顧客の購買傾向分析

『ヒストグラム』はデータの分布の基本的なツールで、様々な場面で役立ちます。

形状、山の高さ、幅、階級幅、外れ値などに注目することで、データの特性をより深く理解することができます。

投稿者 ビビット

アニメ好きのしがないサラリーマンです! ~好きなアニメ~ ヒロアカ、メジャー、クロスゲーム、進撃の巨人、ハンターハンター、弱虫ペダルなど

関連投稿

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です