クラスター分析とは、多くの異なったものがあるデータを、似たもの同士に分類するための分析方法です。
マーケティングにおいては、市場調査や顧客情報の分析などに使われます。
この記事では、クラスター分析の種類と応用例、クラスター分析を使用する上での注意点について見ていきましょう。
クラスター分析とは?
クラスター分析とは、多くの異なったものがあるデータを似たもの同士に分類するための分析方法です。
クラスター分析は、マーケティングにおいて、市場調査や顧客情報の分析などによく使われます。
クラスター分析の種類は、「階層型」と「非階層型」に大きく分けることができます。
それぞれにメリットとデメリットがあるために、データの種類や分析の用途に応じて使い分けることが必要です。
クラスター分析は、巨大データの傾向や特徴を把握するために強力な方法です。
ただし、万能な分析方法ではありませんので、使用する際にはその限界をよく理解しておくことが重要です。
関連記事:マーケティングとは?基礎から重要ポイントまで初心者にも分かりやすく解説
クラスター分析の種類
クラスター分析には、
・階層型クラスター分析
・非階層型クラスター分析
の2種類があります。
このそれぞれについて、どのようなものなのかを見てみましょう。
●階層型クラスター分析
階層型クラスター分析は、クラスター分けを、最も似ている類似度が高いものからスタートし、徐々に似ていないものへと段階を踏んで行うものです。
階層型クラスター分析のイメージは、下の図のようになります。
【階層型クラスター分析のイメージ図】
上の例においては、最も類似度が高いAとBとがまず同一のクラスターに分類され、次にCとDとが同一クラスターに分類されます。
その次に、ABのクラスターとCDのクラスターが、1つの大きなクラスターとして分類され、遠く離れたEは、最後に全体が1つのクラスターになったとき、ようやくそこに分類されます。
階層型クラスター分析は、クラスターに分類されるプロセスが、上の図右側の「デンドログラム」としてトーナメント図のように示されます。
そのために、デンドログラムを見ながら、いくつのクラスターに分けるのかを分析後に決めることができるのがメリットです。
上の例でいえば、クラスターを「AB」「CD」「E」の3つとすることもできますし、「ABCD」「E」の2つとすることもできます。
ただし、階層型クラスター分析には大きな欠点もあります。
それは、すべての要素間の類似度を総当たりで計算するため計算量が多くなり、データの数が多くなると計算が困難になる場合があることです。
したがって、ビッグデータなど非常に多数のデータを分析する場合には、次で見る非階層型クラスター分析を用いることが一般的です。
●非階層型クラスター分析
非階層型クラスター分析は、階層型クラスター分析のように総当りでの計算を行わず、計算を簡略化したものです。
そのために、ビッグデータなどの分析を行う際には、こちらが主に用いられます。
ただし、非階層型クラスター分析は、いくつのクラスターに分類するかを計算の前に決めなければなりません。
そのため、クラスター数を変えながら何度か実際に計算してみるなど、適切な結果を得るために試行錯誤が必要となることがあります。
また、計算時には初期値を決めなければなりません。
この初期値によっても結果が変わってくる場合があります。
そのために、初期値についても、何度か変えながら計算をしてみる試行錯誤が必要となることがあります。
クラスター分析の応用例
クラスター分析は、
・市場調査
・顧客アンケート
・クレジットカードやポイントカードなどの顧客情報
などの分類をすることが、ポピュラーな使われ方です。
市場調査や顧客アンケート、カードの顧客情報のデータには、年齢や性別、住所をはじめとする様々な情報が盛り込まれています。
これらのデータをクラスター分析することにより、たとえばクラスターとして、次のようなものが得られたとします。
・高級品志向タイプ
・流行追求タイプ
・低関心タイプ
・保守タイプ
このように分類されることにより、データ全体の傾向を把握することが容易になります。
また、顧客アンケートやカードの顧客情報の場合なら、クラスターごとに、顧客の関心に見合った商品を紹介したDMを送る、などのことも可能となります。
クラスター分析を使用する際の注意点
クラスター分析を使用する際の注意点として、
・クラスター分析は「客観的」と言い切れない
・他の分析方法との併用が必要
の2つをあげることができます。
●クラスター分析は「客観的」と言い切れない
これは、実際に用いられることが多い非階層型クラスター分析に特にいえることとなります。
非階層型クラスター分析では、クラスターの数をあらかじめ決めなければなりません。
また、初期値の値によっても結果が変わってくることがあります。
したがって、非階層型クラスター分析は、「客観的な分析」と言い切ることはできません。
分析結果は、分析者の判断が含まれるものとなります。
クラスター分析を客観的なものとして絶対視しないよう、注意することが必要です。
●他の分析方法との併用が必要
また、クラスター分析は、あくまでも「分類」をするだけです。
その分類が、どのような法則性や因果関係により生じたものかは、クラスター分析では明らかにできません。
したがって、業務改善などの実際のアクションを検討する場合には、クラスター分析の結果だけから判断しないことが重要です。
判断は、回帰分析や相関分析など他の分析方法を併用し、より多面的な分析結果が得られた上で行うことが大切です。
まとめ
◆ クラスター分析とは、多くの異なったものを似たもの同士に分類するための分析方法
◆ クラスター分析には「階層型」と「非階層型」とがある
◆ クラスター分析は、市場調査や顧客アンケート、カードの顧客情報などの分類に使われる
◆ クラスター分析は客観的なものとは言い切れないこと、また分類をするだけであることを理解しておくことが重要