重複コンテンツとは、ドメインの中や外に同じ情報が掲載されたWebページが複数存在し、それぞれで異なるURLを持っているコンテンツのことです。
重複コンテンツがサイトの内外にあると、SEO効果が下がってしまう可能性があります。そのため、サイト管理者は可能な限り重複コンテンツの発生を防いでWebサイトを運営していくことが求められます。
本記事では、重複コンテンツの概要や、チェック方法、対策方法について解説していきます。
関連記事:SEOにおけるカニバリゼーションの問題点と解決方法について
目次
重複コンテンツとは
重複コンテンツとは、サイトの内外に同じ情報をもつWebページが複数あり、それぞれで異なるURLを持っている状態を指します。
例えば、同じ商品の説明文が複数のページで使用されている場合や、複数のページで同じ内容の文面が掲載されている場合などが挙げられます。これらの場合、検索エンジンはどのページを優先して表示すればよいのか判断がつかず、結果として、重複している記事の検索順位が下がってしまう可能性があるのです。
GoogleはWebサイト運営に際し、重複コンテンツの生成を避けるように推奨しています。Googleの基準によると、完全に同じ内容がコピーされたページや、あるいは大部分が同じで一部だけが違っている類似ページの場合も、重複コンテンツだと判定します。
Googleは、複数のページが同じコンテンツを含んでいる場合、どのページを優先して検索結果に表示するかを判断するアルゴリズムを持っています。ページの更新頻度や品質、ドメインの信頼性などを考慮して、検索結果の上位に最適なページを表示するように設計されているのです。
複数のページに同じ内容のコンテンツが存在している場合、検索エンジンの検索順位を下げる可能性があるため、重複はなるべく避けることが望ましいでしょう。
関連記事:ホームページ制作や運用でやってはいけない31のことを解説!
重複コンテンツによるSEO対策への影響
悪意のあるなしに関わらず、重複コンテンツを作成して放置してしまうと、SEO対策にはどのような影響があるのでしょうか。詳しく説明していきます。
被リンク評価が分散してしまう
重複コンテンツが存在すると、被リンクされた場合の評価が分散するため、各ページのSEO対策の効果も減少してしまいます。
Webサイトの運用や開発上の問題点から生じる場合もあるため、その場合は早急に解決する必要があるでしょう。
関連記事:SEOにおいて重要視される被リンクの効果と増やす方法について
類似したページが複数あると検索結果の上位に表示されにくくなる
重複コンテンツが存在する場合、検索エンジンはどのページを優先して表示すべきか判断がつかず、結果として全ての記事の検索順位を下げてしまう可能性があります。
解決策としては、重複ページや類似ページを統合し、1つのページにまとめることをおすすめします。そうすれば検索エンジンは優先的に表示するべきものを判断しやすくなり、検索順位を上げることができるでしょう。
検索エンジンは、ページのURL、タイトル、ページの概要を示したdescriptionなどのメタデータ、コンテンツの本文や画像、動画など、さまざまな要素を考慮してランキングを決定します。重複や類似したコンテンツを持つページがある場合は、これらの要素を変更して、検索エンジンが優先的に表示するページを明確にすることが必要です。
具体的には、URLの正規化や、タイトルやメタデータの変更、コンテンツの入れ替えなどが挙げられます。詳しい手法については後述します。
関連記事:SEO対策で大切な「タイトルの付け方」と「ディスクリプションの書き方」について
ユーザー体験(ユーザーエクスペリエンス・UX)を損ねてしまう
重複コンテンツが存在する場合、ユーザーによっては同じ情報を複数回見てしまうことも考えられます。この状態はユーザーの利便性を損ねるだけでなく、サイトに対する信頼性を低下させる可能性もあります。
例えば、同じ文面が複数のページに掲載されている場合、ユーザーは「同じようなものをさっきも見た」と不快に感じ、サイトへの信頼性が低下することもあるのです。
重複コンテンツが多数存在すると、ユーザーが探している情報を見つけるのが難しくなる可能性があり、ユーザーの利便性が低い(UXが低い)サイトだと検索エンジンに判断されると、検索順位に悪影響を与えることもあります。
したがって、同じコンテンツを複数のページに掲載しないようにすることがとても重要です。例えば、同じ商品情報を掲載する場合には、1つのページにまとめ、異なる切り口や角度で商品を紹介するページを作成しましょう。そうすれば重複コンテンツだとは見なされず、ユーザーの利便性も向上し、検索エンジンの評価も高くなるでしょう。
重複コンテンツのチェック方法
Webサイトにおいて重複コンテンツが存在することは好ましくありません。ここからは重複コンテンツのチェック方法について説明していきます。
Google Search Consoleでチェックする
Google Search Consoleは、Webサイトの検索エンジン最適化に必要な機能を提供する無料のツールです。どのような検索キーワードで自身の運営するサイトが検索エンジンに表示されたのか、どのキーワードで実際に自身のサイトへのリンクがクリックされたのかがわかります。
また、Google Search Consoleは重複コンテンツをチェックする機能も備えており、サイト全体や個別のページ単位で重複をチェックできます。
具体的には、Google Search Consoleの画面左側に並ぶメニューから「セキュリティと手動による対策」→「手動による対策」をクリックします。ここで「問題は検出されませんでした」という画面が出れば対策をする必要はありません。
問題が検出された場合は、サイト内で重複するURLが表示されます。重複データが表示された場合は、原因を調査し、メタデータやコンテンツを修正するか統合や削除などをしてください。
関連記事:Google search console(サーチコンソール)とGoogle Analytics(グーグルアナリティクス)の違いを解説!使い分け方と連携方法とは
コピペチェックツールを利用する
Webサイトのコンテンツが他のサイトからのコピーやスクレイピングによって転載され、重複コンテンツとなっていることもあります。そのような場合には、コピペチェックツールを利用して検索してみることができます。
コピペチェックツールは、Web上の文章を比較して、重複している部分を検出するツールです。ツールを利用することで、自分のサイトが重複コンテンツとなっていないか、他のサイトからのコピーがないかを確認することができます。
類似ページ判定ツールを利用する
Googleのアルゴリズムは複雑であるため、アルゴリズムを理解したうえでWebページの最適化を図らなければなりません。
類似ページ判定ツールは、アルゴリズムに基づいて重複しているものを判定するためのツールです。これらのツールを使用することで、Googleがどのように評価をおこなっているかを知ることができます。
検索結果ページのURLの後ろに「&filter=0」のパラメータを追加する
Googleの検索結果ページには、同じサイトの似たようなコンテンツが複数回表示されないように、フィルタリングをする機能があります。
そこで検索結果ページの後ろに「&filter=0」というパラメータを追加すると、フィルタ機能が解除され、重複するページを検索結果に表示することができます。
このパラメータを使うことで、重複コンテンツを検索画面でもチェックすることができるのです。
重複コンテンツの対策方法7選
重複コンテンツは検索順位に悪影響を与えることがあるため、重複コンテンツをなるべく生成しないようにする対策が必要です。ここでは、7つの対策方法について解説します。
重複コンテンツの統合、削除後に301リダイレクトを使用する
301リダイレクトは、古いページを新しいページにリダイレクトする方法です。301リダイレクトでは、古いページの被リンク評価を新しいページに伝えることができるため、SEOに有効です。
ただし、301リダイレクトをするとサイト全体の構造にも影響を与えるため、慎重に行う必要があります。
関連記事:リダイレクトとは?種類や設定方法、必要なタイミングを解説
canonicalを設定する
canonicalは複数のURLに同じコンテンツがある場合、優先するURLをWebページのHTML内にある<head>要素の中で指定する方法です。canonicalを使用することで、Googleが優先するURLを認識することができます。
canonicalによって優先するURLを指定することを「URL正規化」などと呼びます。
noindexの設定
noindexは、Googleに対してページのインデックス(Googleのデータベースに登録すること。クローリング)を行わないように指示する方法です。これを使用することで、Googleが同じコンテンツを複数のページとして認識することを防ぐことができます。ただし、noindexはページの検索結果から完全に削除するわけではないため、注意が必要です。
関連記事
・noindexとnofollowの違いとは?SEO効果を上げる使い方を徹底解説!
・クローラーとは? 検索エンジンの仕組みを解説します!
トップレベルドメインを使用する
たとえばグローバル企業において、同じ内容の異なる言語のページを保有する場合、サブドメイン(例:https://japan.●●●.com、https://korea.●●●.comなど)やディレクトリ(例:https://www.●●●.com/ja/、https://www.●●●.com/ko/など)にファイルを置かず、トップレベルドメイン(例:https://www.●●●.jp、https://www.●●●.krなど)で運用することをおすすめします。
関連記事:ディレクトリとは?仕組みや一般的に使われる意味を解説!
定型文の繰り返しを最小限に抑える
定型文の繰り返しも、検索エンジンに重複コンテンツと見なされる原因の1つです。定型文を使用する場合は、冒頭部分など一部を抜粋して詳細ページへのリンクを張るなどして、繰り返しの使用を最小限にとどめるようにしましょう。
類似するコンテンツをできるだけ少なくする
同じ内容のコンテンツを大量に生成することは、SEOにとってマイナスに働きます。
重複コンテンツとされるWebページの多くは自動生成によるものです。自動生成でページを作成する場合は、サイトの品質に大きな損害を与えることがあるので、注意してください。
同じようなテーマのコンテンツが多数存在する場合は、統合をおすすめします。この方法を使用することで、ページ数が減り、サイトの品質は向上するでしょう。
Googleにコンテンツを削除要請する
サイトの管理者はGoogleのデータベースから重複コンテンツを削除する要請を送ることができます。
特定のページ、またはページの一部をGoogleのインデックスから完全に削除したい場合は、Googleに削除要請を行なってください。これまで紹介した手法を試し、それでもうまくいかなかった場合は、この手順を実行しましょう。
削除要請を行うには、Google Search Consoleの「削除ツール」を使用します。削除ツールには「URL削除」「サイトマップから削除」「不要なページの削除」といったオプションがあります。これらのオプションを使用することで、Googleに対して削除要請を送信することができます。
まとめ
重複コンテンツは、SEOに対して悪影響をおよぼすことがあるため、その問題について理解しておくことが重要です。
対策としては、サイトの品質を向上するために、301リダイレクト、canonicalによる正規化、noindexの設定、トップレベルドメインでの運用、重複・類似コンテンツの統合や削除、Googleへの削除要請、などの手法があります。
これらの手法を組み合わせて使用することで、問題を解決することができます。また、SEO対策においては、サイトの品質とユーザーエクスペリエンス(UX)が重要である点も忘れないでください。