【Excelでも作れる】散布図とは何か?品質管理で使われる相関関係を見つけるためのツール

散布図の概要

散布図(scatter plot)とは、縦軸と横軸に別の特性を割り当て、2項目間の分布や相関関係を把握するために使用される図法です。品質管理の「QC7つ道具」の1つに数えられています。品質管理で利用しているデータが不十分と感じて、品質管理基準を見直す際に散布図が使用されます。

散布図の作図方法

Excelで散布図を作成する

参考画像1:Excelで散布図を作成する様子

Microsoft OfficeのExcelを使用すれば、散布図は簡単に作成することができます。
Excelで2つの項目のデータを作成し、それらを選択した状態で参考画像1のように「挿入」のタブから、「散布図(X,Y)またはバブルチャートの挿入」を選び、「散布図」のボタンを選択します。
そうすると、自動的に散布図が作成されます。

散布図のメリット

散布図を活用すると次のようなメリットが得られます。

2項目間の相関関係が分かる

右上がりの正の相関(画像はWikiより)
右下がりの負の相関(画像はWikiより)

縦軸と横軸で別の特性を割り当てる散布図を使用すれば、2項目間の相関関係の深さを調査できます。散布図に万遍なく点在していれば、相関関係が薄い、もしくは全く相関関係がない「無相関」だと判断できます。
右上がりの帯状に分布していれば「正の相関」があると判断でき、右下がりなら「負の相関」があると判断できます。
正の相関関係の項目は、片方の項目の数値が増えれば増えるほど、もう片方の数値も増えます。例えば、身長が高い人ほど体重は増えるため、身長と体重の2つの項目を散布図で示すと右上がりの帯状になります。したがって、身長と体重には、正の相関関係があると見なすことができます。
負の相関関係の場合は、片方の項目の数値が増えれば、もう片方の数値が減少する関係にあります。例えば、マンションやアパートの賃貸市場では、その物件が駅から距離が遠くなるほど家賃は下落します。そのため、駅からの距離と家賃を散布図で示すと右下がりの相関関係を示します。したがって、家賃と駅からの距離は負の相関関係があると見なすことができます。

グループ分けができる

散布図は、2項目間の相関関係だけではなく、項目群のグルーピングをする際にも活用できます。全体の傾向から大きく外れた特異点を除外したり、点の集まり具合から、同じ傾向を示したりして項目をグルーピングできます。そのため、似た性質の項目をグルーピングしたい場合にも散布図が使用されます。

散布図の注意点

散布図を使う上で気を付けなければならないのは、因果関係は散布図からはわからないということです。
例えば、「親の年収」「こどもの学力」には正の相関があると言われています。しかし、それは何故なのでしょうか?
「学費の高い塾や予備校に行けるから」「年収の高い親は教育熱心だから」というように、様々な理由は頭に浮かぶものの、それが事実であるかはさらに調査を進めていかなければなりません。
このように、散布図は2つの項目に何かしらの関係があることはわかるものの、「~だから2つの項目の間には相関関係がある」というような因果関係を紐解くには、さらなる調査が必要です。
そのため、散布図だけを見て2つの項目の関係の結論を急いでしまうと、事実の把握を誤ることになります。

散布図の活用事例

ここからは散布図の活用事例をご紹介します。

品質管理

冒頭で述べた通り、散布図は「QC7つ道具」の1つに数えられるほど、品質管理と親和性の高い図法です。
品質に影響している項目を発見するために、縦軸に「不適合の製品数」「不具合数」をとり、横軸に様々な項目を当てはめながら、相関関係のある項目を探し出していきます。

アンケート調査

散布図は品質管理の際に使用される機会が多いですが、その他にも、さまざまな場所で使用されています。
例えば、アンケート調査の結果を分析する際にも、散布図は有効です。
「あなたがこのサービスに点数をつけるとしたら何点ですか?」という項目の点数と他の項目の数値を散布図で表現することにより、両者の間に何か関係がないかを確認することができます。

この他、アンケート調査の表現方法については、下記の記事もご参照ください。

顧客満足度調査

アンケート調査と似ていますが、散布図は顧客満足度調査でも使用されます。
「どのような傾向のときに、顧客満足度が高くなるのか?」「どのような数値が増えれば、顧客満足度が低くなってしまうのか?」を的確に把握することで、ビジネスに役立てていくことができます。

顧客満足度調査については、下記の記事もご参照ください。