重回帰分析は、統計学で用いられる分析手法の1つで、将来の予測をしたい場合に使用します。重回帰分析の「重」には複数といった意味が込められており、「回帰」には因果関係といった意味が込められています。しかし、重回帰分析といった言葉を聞いたことはあるものの、具体的にどのような場面で使用したり、そもそもどのように使用すれば良いのか分からなかったりする方は多いのではないでしょうか。
そこで本記事では、重回帰分析の概要や単回帰分析との違い、重回帰分析を行う手順を解説します。また、重回帰分析を行う際に気をつけるべき複数の注意点もご説明しますので、ぜひ参考にしてください。
目次
重回帰分析とは?
まずは、重回帰分析の意味を解説します。重回帰分析とは、統計学に用いる分析手法の1つで、重は複数、回帰は因果関係のことを示します。重回帰分析は、目的変数といったある結果を説明したい場合に、説明変数であるそれらにまつわる複数の要因を分析し、それぞれが目的に対してどれだけの因果関係があるかを調べる際に使用します。また、それぞれの因果関係が分かるため、それらを基に将来の予測を立てることも可能です。
たとえば、全国に20営業所を展開しているタクシー会社が存在したとします。重回帰分析では、このタクシー会社に対して、従業員数や1日に可動できる車の台数、1日の利用者数、時間帯、駅からの距離などを分析していきます。それらの結果を基に、次にタクシーの営業所として展開するべき地域や従業員数、タクシーの台数などを決定するのが重回帰分析になります。
つまり、重回帰分析はビジネスの成功確率を高める上で非常に重要な分析の1つであり、売上を予測する際やマーケティング戦略を練る際に役立ちます。
関連記事:マーケティングとは?基礎から重要ポイントまで初心者にも分かりやすく解説
単回帰分析と重回帰分析の違い
重回帰分析の概要を解説しました。しかし、単回帰分析との違いが分からない方は多いのではないでしょうか。結論、1つの要因に対して、将来の予測を立てることを単回帰分析と言います。たとえば、月額100万円の広告費に対して、1,000万円の売上を得たとします。このことから、広告費の1,000%が売上として返ってくることが分かります。このように、広告費という1つの要因に対して、将来を分析するのが単回帰分析の概要です。
一方の重回帰分析は、広告費や出稿エリア、ユーザーの年齢や年収、抱えている悩みなど、複数の要因から分析を行います。小規模のビジネスやマーケティングでは、成功確率をより高めるために重回帰分析が用いられることが多いです。しかし、大規模なキャンペーンを打ち出す際や、一定以上の広告費をかける場合、商品やサービスの認知拡大を目的として単回帰分析が用いられることもあります。
重回帰分析は「要因分析」と「予測分析」に対応可能
ここまで、重回帰分析の概要や、単回帰分析との違いを解説してきました。重回帰分析では、下記2種類の分析に対応可能です。
・ 要因分析
・ 予測分析
それぞれ順番に見ていきましょう。
要因分析
まず、重回帰分析では、それぞれの要因を分析可能です。たとえば上述したタクシー会社を例にすると、従業員数やタクシーの台数、時間帯、駅からの距離感などが要因として挙げられます。そして、これらの要因がタクシー会社の売上や集客数に対して、どれだけのインパクトを与えているのかを分析するのが要因分析です。仮に、売上に対して最もインパクトを与えている要因が「駅からの距離感」であった場合、タクシーの営業所は駅から5分以内の場所に設置するべきという仮説を立てられます。つまり、売上や集客数などの目標に対して、最も重要視するべき要因は何であるかの仮説を立てるのが要因分析になります。
予測分析
重回帰分析では、予測分析を行うことも可能です。予測分析では、上述した要因分析で洗い出された項目を、数値に置き換えて分析を行います。
なお、重回帰分析は説明変数(要因)が複数あるため、数式では「y=ax1 + bx2+C」などと表します。aやbは係数、Cは定数項(切片)と呼ばれ、定数項は、説明変数の変動には影響されません。仮に、上述した要因の中で影響度の大きい要因を「駅からの距離感」「従業員数」「タクシー台数」とした場合、方程式は「売上(y)=0.5×駅からの距離感+0.3×従業員数+0.1×タクシー台数+0.8」となります。上記に入っている数字はサンプルですが、重回帰分析の予測分析では、現状の数値に別の数値を当てはめ、そこから将来に得られるであろう売上を予測可能です。そのため、新規事業を立ち上げる際や、新たな営業所を展開する際に役立つと言えるでしょう。
売上分析の例として、統計分析研究所のコラムでは詳しく重回帰分析が紹介されています。
重回帰分析を行う手順
ここまで、重回帰分析に関して解説をしてきましたが、具体的にどのように行えば良いか分からない方は多いのではないでしょうか。ここからは、重回帰分析を行う手順をご説明します。
・ 目的変数の決定
・ 説明変数を考察
・ 実際にデータを収集して分析を行う
・ 予測を基にマーケティング戦略を練る
それぞれ順番に見ていきましょう。
目的変数の決定
まずは、目的変数を決めましょう。基本的にはビジネスモデルや経営戦略に合わせて決めれば問題ありません。重回帰分析の目的変数では、その多くが売上や集客数などに決められることが多いです。
説明変数を考察
目的変数を決めたら、次は説明変数を考察していきます。たとえば、目的変数を「全国に10店舗ある飲食店の売上高」と定めたとします。説明変数としては無数に考えられますが、代表的なものは下記のとおりです。
・ 競合店舗数
・ 立地(アクセス)
・ 顧客単価
・ メニュー数
・ 割引やキャンペーン
・ 商圏人口
・ 席数
・ 広告費
・ 従業員数
・ 口コミ数
・ クレーム数
これらの中から、売上という目的変数に対して特にインパクトを与えている説明変数を決めていきます。注意点としては、説明変数をあまりに多くしすぎてしまうと、それぞれの分析に対する詳細なデータを得にくいため、重要な変数のみに絞り込むことが大切です。
実際にデータを収集して分析を行う
目的変数と説明変数が決まったら、実際にデータを収集する段階に入ります。この際、1ヶ月間や1年間など、具体的な期間を決めることが非常に大切です。なぜなら、期間を決めることでそれぞれの要因に対する比較を行うことができ、より最適な施策や改善案を洗い出せるためです。
予測を基にマーケティング戦略を練る
期間を定めてデータを収集できたら、予測を基にマーケティング戦略を練りましょう。たとえば、分析以前の段階では、広告費よりも立地のほうが売上に対するインパクトが大きいと予測していたとします。しかし、実際には広告費のほうが与えるインパクトが大きいと分かった場合、毎月の広告予算を上げるといった戦略を考えます。
他にも、自社の商品を求めている顧客の年齢層や市場規模を踏まえて、広告費をどこの媒体に投下するかも検討していきます。重回帰分析でそれぞれの要因を詳細に理解できていれば、ビジネスやサービスの成功確率は確実に高まっていると思って良いでしょう。
重回帰分析を行う際に注意するべきポイント
ここまで、重回帰分析を行う手順などを解説してきましたが、下記2つの注意点を理解しておくことも大切です。
・ 変数はすべて数値化する
・ 説明変数を増やしすぎない
それぞれ順番にご説明します。
変数はすべて数値化する
まず、変数はすべて数値化することを心がけましょう。たとえば、男女や親子は一般的には数値化できない指標の1つになります。しかし、男は0、女は1とするなど、必ず数値化することが重要です。なぜなら、数値以外の指標はすべて分析することが困難であり、それぞれの要因に対する具体的な予測を立てられないためです。数値以外の質的変数がある場合でも、必ず数値に変換して分析を行うようにしましょう。
説明変数を増やしすぎない
先ほども少し解説しましたが、説明変数は増やしすぎないことが大切です。なぜなら、説明変数が多すぎてしまうと、結果的にそれぞれの説明変数が目的変数に与える影響度が小さくなり、有用なデータを得られないためです。
一般的に、重回帰分析の説明変数は7個程度が良いとされています。そのため、特に影響を与えているであろう説明変数に絞り込んだ上で分析を行いましょう。仮に分析を行った上で、有用なデータを得られないようであれば、次の分析に使用する説明変数を変更すれば問題ありません。
まとめ
本記事では、重回帰分析の概要や単回帰分析との違い、重回帰分析を行う手順などを解説しました。重回帰分析では要因分析や予測分析を行うことができ、それぞれの要因が売上に対して与えるインパクトや、新規事業を立ち上げた際の売上等を予測できます。つまり、ビジネスを行う上では欠かせない分析手法の1つだと言えるでしょう。
現状の課題を解決し、ビジネスの成功確率を高めるために、まずは重回帰分析を行ってみてはいかがでしょうか。