「データマイニング」といえば、国内最大級のネットオークションであるヤフーオークションにおいて、不正利用防止に役立つ技術としても有名です。
ネットオークションに関わる膨大なデータから、データマイニングによって不正利用者の行動パターンのモデル化に成功しています。
そこで今回は、この「データマイニング」について、基本的な意味から分析手法までまとめて解説します。
データマイニングとは?
データマイニング (Data mining)の「マイニング」とは、発掘や採掘を意味します。
そのためデータマイニングを直訳すれば、「データから採掘すること」となります。
一体、データから「何を」採掘するのか?と疑問に思うかもしれません。
この採掘の対象となるものこそが、データマイニングの目的です。
つまり膨大なデータから、人間では発見できない「有益な法則や相関関係、一定の傾向やパターンなど」を得ることが、データマイニングの目的といえます。
データマイニングの流れ
データマイニングを行うには、以下の流れで行うのが一般的です。
企業の持つビッグデータから有益な法則や相関関係を採掘するためには、元となるデータを漏れなく蓄積し、分析できるように整理しなければなりません。
そのためには、データの保存場所となる「データウェアハウス」を設けて、すべてのデータを更新や削除せずに、次々と蓄積させることから始めます。
蓄積されたデータの中にある「数値データ」や「記号データ」については、その形式を統一することが必要です。
形式を統一することは、データから取り出す結果の精度をより高めるためであり、データマイニングの下準備となります。
あとは目的に応じたさまざまな分析法により、データから隠れた法則を見出します。
人工知能による機械学習にて分析を行う場合には不要ですが、「回帰分析」など統計学を活用した分析を行う場合には、事前に仮説を立てる必要がある場合もあります。
データマイニングの3つの分析手法
データマイニングには、目的に応じたさまざまな分析手法があります。
ここでは、3つの分析手法を紹介します。
ロジスティック回帰分析
ロジスティック回帰分析は、事象が発生する確率を予測する分析方法です。
たとえばあるキャンペーンを行ったとして、顧客である企業が「購入する」もしくは「購入しない」と明確に定義づけが可能である場合、この分析手法で購入の確率が予測できます。
クラスター分析
クラスター分析は、顧客を分類する際に用いられる分析手法です。
購買行動だけでなく、趣味嗜好などのさまざまな項目から、「類似している」と判断されたまとまりを、一つの集団として分類していきます。
セグメンテーションを行う際に有益といえます。
クラスター分析によりそれぞれの集団に対して、その性質にあった広告、さらには踏み込んだ提案などが可能となり、さらに1顧客にフォーカスした1on1マーケティングも実行できるでしょう。
アソシエーション分析(マーケット・バスケット分析)
アソシエーション分析は、製品やサービスそれぞれの相関関係を発見できる分析手法です。
消費者が商品を入れた買い物かご(マーケット・バスケット)の中身から、何を購入したのか、商品の組み合わせを調べるところから、「マーケット・バスケット分析」ともいわれます。
たとえば「Aという商品を購入する顧客はBという商品も一緒に購入する」との相関関係が成り立てば、AとBの商品をともに売り込むマーケティング戦略も可能です。
具体的には、Aの商品を購入した企業に対して、Bの商品の購入を促すダイレクトメールを送信することが考えられます。
さらにはAとBを一緒に購入する理由や背景が理解できれば、同じ類似性を持つCという商品を提案することも検討できるでしょう。
データマイニングの本当の効果は、分析後からが勝負!
データマイニングにおいてもっとも重要なことは、分析から得た法則や傾向を活用できるか、ということです。
発見された法則や傾向、パターンなどは、単なる事実でしかありません。
2つの項目に相関関係があると分析結果が出たとしても、実際に自社のマーケティングにおいて「有益か」どうか判断する必要があるからです。
分析結果が示す事実に対して、どうしてそのような相関関係が出来上がるのか、その理由や背景を推測することも人間の知能の領域です。
法則やパターンの仕組み自体を理解しなければ、データマイニングを活かすマーケティングは行えないでしょう。
そのためには、これらを読み解けるだけのスキルを持つ人材、データサイエンスの領域に明るい人材が必要といえます。
IT技術の進化に加え、SNSの発達により、一個人、一企業のデータがあらゆるところに蓄積しています。
そのデータ量は膨大であり、マーケティングの視点からいえば、「お宝眠る鉱山」がいたるところにあるといえます。
あとは「金脈」を探り当てられるか、もしくは「金脈」と判断できるのかが重要です。最終的には人間の持つマーケティングスキルにかかってくるのかもしれません。
まとめ
◆データマイニングの目的は、「有益な法則や相関関係、一定の傾向やパターンなど」を得ることである
◆データマイニングは、分類するにはクラスター分析、相関関係の発見にはアソシエーション分析など、目的に応じた分析手法がある。
◆データマイニングにおいて、分析から得た法則や傾向を活用できるかが大きなポイント