ミラーサイトのリスクとは?Googleのペナルティの対象に?
ミラーサイト(コピーサイト)は、あるWEBサイトの内容の一部、または全部を複製したサイトのことです。Googleのペナルティの対象となることがあり、WEBサイト制作・運営者にとって気をつけなくてはならない要素の1つです。
この記事では、ミラーサイトの基本とリスク、被害を受けないための対策法・受けたときの対処法を解説します。
この記事の目次
ミラーサイト(コピーサイト)とは?
ミラーサイト(コピーサイト)は、文字通りサイト内部に重複コンテンツを持つため、下記のような可能性が生じることになります。
|
重複コンテンツは、重複する対象のコンテンツがサイト内にあるか他ドメインにあるかを問いません。そのため、ミラーサイトの存在はオリジナルサイトのSEOにとって悪影響を及ぼす可能性が高く、SEOに携わる者にとって注意すべき要素です。
注意すべきポイントが多数存在する一方で、有効な利用方法も存在しています。その点も踏まえ、基礎から段階を追って詳しくみていきましょう。
ミラーサイトのリスク:SEOでペナルティの対象に
2011年2月にGoogleの検索エンジンに実装された「パンダアップデート」と、被リンクを解析しスパムサイトを検出する「ペンギンアップデート」によって、現在ではミラーサイトをはじめとする重複コンテンツは検索エンジンにほとんど表示されなくなりました。
ミラーサイトなどの重複コンテンツが存在するとどのような現象が発生するのか、可能性があるものを見ていきましょう。
- ページの検索順位が大幅に低下する、または検索結果に表示されない
- サイト全体の検索順位が低下する
- サイトのトップページが検索結果に表示されないか、順位が大幅に低下する
低品質の重複コンテンツが検索結果に表示されることは、ユーザーにとっての検索エンジンの利便性を低下させます。
もし、誤ってオリジナルサイトが「重複コンテンツ」と判定された場合、順位が下がるか最悪の場合は検索結果に全く表示されなくなってしまう恐れがあります。これは下記で紹介する「アクセス負荷軽減のためのミラーサイト」を設置した場合も同じです。
また、第三者の作るミラーサイトには、オリジナルサイトへのリンクが残る場合が多く、「ブラックハットSEO」と誤認される危険性もあります。
ミラーサイトが未だに存在する4つの理由
パンダアップデートによってミラーサイトが排除されるようになった今でも、ミラーサイトは多数存在します。その理由は、主に次の4つのによるものです。
①ミラーサイトは過去では有益だった
ミラーサイトによるSEOは、パンダアップデート以前では有効な手段の一つでした。
- 検索上位サイトのコンテンツを転載したミラーサイトを作り集客する
- 他サイトの情報をシステム的に収集(スクレイピング)してサイトを量産する
これらの手法で用いられたミラーサイトは、現在でもインターネット上に残っています。特に自動収集システムは無作為にコピーするため、新たに自社のミラーサイトが出現する可能性もあります。
※アルゴリズムアップデートの変遷を知りたい方は以下の記事もご参照ください
https://hitonote.co.jp/wp2/column/seo/5397/
②悪質な目的での利用
悪質な業者によって、現在でもミラーサイトが作成される例もあります。
例えば「フィッシングサイト」と呼ばれる手法です。有名なサイトのログイン画面を模倣し、ユーザーの会員情報や顧客情報を取得しようとします。
他にも、高品質のサイトや記事のコンテンツをコピーすることで安易にページを量産し、アフィリエイト広告やリスティング広告を掲載して収益を得るという手口もあります。
これらの悪質なサイトは他社からコンテンツを転載するため、重複コンテンツやミラーサイトが現在でも存在する原因と言えるでしょう。
③意図せず作成されるミラーサイトの存在
意図的にミラーサイトを作らずとも、サイト内にミラーコンテンツが生成されてしまうことがます。
- リストページ
- ECなどの商品ページ
- 検索ページ
例えば、上記のページの類似ページを作成するといった行為がこれに当たります。
例に挙げたページは、いずれもユーザーの利便性を考慮した上で作成されたり、その他の健全な目的で作成されたりする場合が多いです。しかし、検索エンジンはあくまでロボットプログラムなので、運営者の意図まで汲み取ることはできず、誤ってミラーコンテンツと認識されて評価を下げられる可能性があるのです。
類似のページを「canonicalタグ」などで1つのURLに絞るか、内容をしっかり書き分けることで重複コンテンツを避けるように意識しましょう。※canonicalタグについては後ほど詳しく解説しています。
また、下記を行った場合も同様に、ミラーコンテンツ・ミラーサイトと認識される場合があります。
- ページ公開後にURL設定変更やサーバー移転
- ドメインの変更
こちらは適切なリダイレクトを設定する必要がありますが、リダイレクトが難しい場合はcanonicalタグで「正しいURL」を指定するか、Googleサーチコンソールにて「URLの削除」を行ってください。
さらに、「サイト内検索の絞り込み」のように自動生成されるケースもあるため、定期的なチェックとメンテナンスが必要になります。Googleサーチコンソールには、タイトルタグや要約(description)などの重複を検出できるので有効活用するようにしましょう。
④サーバー負荷の軽減に利用される
サーバーへのアクセス負荷や転送量負荷を軽減するため、ミラーサイトが利用されることがあります。これは、SEOが知られるようになる以前から導入されてきた手法です。
▶︎ サーバーへのアクセス集中が予想される場合
一時的にサーバーアクセスが集中するとサーバーに負荷がかかってしまうため、負荷を分散させる予防策としてミラーサイトが利用されます。
万が一サーバーがダウンしてしまっても、ユーザーはそのミラーサイトを利用することができるので、臨機応変な対応が可能になるのです。
▶︎ 大容量のファイルを配信する場合
サーバーのアクセス処理能力に余裕があっても、データ転送量が大きい時などはページ表示やダウンロードに時間が掛かってしまうケースでも利用されます。
ミラーサイトからファイルのダウンロードを行うよう誘導することによって、オリジナルサイトの通信速度を確保することができるのです。
このような健全な目的でミラーサイトを利用する場合は、これから解説する適切な作り方を参考にしてペナルティの可能性を回避するようにしましょう。
ミラーサイトとしてペナルティを受けなくする2つの作り方
自社のオリジナルサイトでミラーサイト(ミラーコンテンツ)が生成される場合は、以下の手段でミラーサイトのペナルティを回避できます。
canonicalタグで回避する
Googleが推奨するのが「canonical(カノニカル)タグ」を記述し、URLを正規化することです。ここでいう正規化とは、「URLを一つに指定すること」と理解してください。別々のURLをもつ複数の類似ページのうち1つを「代表のURL」として指定することで、この問題を解決できます。
canonicalタグを実装するには、類似ページすべてのHTMLヘッダー(<head>~</head>)に以下の記述を行いましょう。
<link rel=”canonical” href=”(類似ページのうち、代表のURL)”> |
ただし、canonicalの使用には注意が必要です。誤って重複していないコンテンツにcanonicalを指定してしまうと、以下のように予期せぬ影響が考えられます。
- 代表URL以外のページが、検索結果から姿を消す
- 違ったテーマのコンテンツが混在し、SEO評価が下がる
canonicalタグについて正しく理解するために、以下の記事も合わせてご参考ください。
noindexタグでインデックスさせない
負荷軽減用のミラーサイトや検索結果に残さなくても良いページは、「noindexタグ」を使うことでミラーサイト問題を解決しましょう。クローラーがページをインデックスする働きを拒否することができます。
noindexタグの設定は、重複コンテンツを含む除外したいページのHTMLヘッダーに以下を記述しましょう。
<meta name=”robots” content=”noindex”> |
こちらもcanonicalタグ同様、意図しないページに記述すると検索結果から削除されてしまうなどの危険性があるため、適切な知識を持って慎重に行う必要があります。
ミラーサイトのチェック方法をご紹介
サイト管理者は、次の2点を常に意識しておく必要があります。
- 自社でミラーサイトを作っていないか
- 第三者によってミラーサイトが作られていないか
例えば、「急に検索順位が下がっている」「インデックス(検索結果に表示)されなくなった、されてない」というような事象が起こった場合は、ミラーサイトの影響を受けている可能性があります。
以下に紹介する方法で、ミラーサイトの存在を定期的にチェックするようにしましょう。
意図的に表示されなかったページを確認する
検索エンジンは、ユーザーに多様性をもたらすために似通ったコンテンツを除外する仕組みを持っており、検索結果ページのURL末尾に「&filter=0」を付加することで意図的に隠されていたコンテンツを表示させることができます。
この作業で表示されたサイトは、ミラーサイトとして認識されている可能性が高いです。しかし、検索するキーワードの空白位置によって表示されるページが変わることもあるため、以下に紹介するツールと併用して確認するようにしましょう。
おすすめのコピーコンテンツチェックツール
Copy Content Detector
公開前のコンテンツ・文章がインターネット上のコンテンツと重複していないかチェックするツールです。特に、アップ前のコンテンツの重複をチェックする時などに役立ちます。
無料で使える範囲でも非常に精度が高いということが特徴で、以下のような多角的な検証が可能です。
- 類似率
- 一致率
- 最大連絡文字数
- 文章校正
さらに、過去にチェックした文章との類似チェックである「テキスト間判定」機能があり、例えばテキストの公募や原稿を外注する場合、転用・転載を防ぐことができます。
ミラーサイトを発見したときの対処法
もし、ミラーサイトを見つけてしまった場合は、どのような対処を行うと良いのでしょうか。詳しく見ていきましょう。
GoogleへDMCA通告を行う
DMCA(Digital Millennium Copyright Act)とは、アメリカで施行された著作権・デジタルコンテンツに対する法律です。GoogleはDMCAに準拠するために、著作権者の申告に応じて著作権侵害をしているコンテンツをインデックスから削除しなければなりません。
許可のないミラーサイトを見つけた場合は、著作権者であるエビデンスを持ってDMCA通告窓口からGoogleに通告を行い、検索結果から除外してもらうようにしましょう。
なお、GoogleへのDMCA通告は以下注意してください。
- DMCA通告によってGoogleが行うのはインデックスからの削除のみであり、WEBサイト自体が削除されるわけではありません。
- Googleへ行ったDMCA通告に虚偽の内容がある場合、逆に損害賠償を求められるケースもあります。
- GoogleへのDMCA通告に異議申し立てが提出され、それが認められた場合、該当のミラーサイトが復帰する可能性があります。
ミラーサイトから自社サイトへ外部リンクが貼られている場合
ミラーサイトから自社オリジナルサイトへのリンクをチェックするには、Googleサーチコンソールの「リンク」検出機能を活用しましょう。
身に覚えのないサイトがある場合は、直ちにそのサイトがミラーサイトでないかの確認を行ってください。もし、自作自演のブラックハットSEOだと誤認識された場合、マイナス評価ばかりかペナルティを受けてしまう可能性があります。
身に覚えのない被リンクは、リンク否認ツールからGoogleに対して拒否を表明することができます。
ミラーサイトによる被害を受けないためには…
ミラーサイトとして誤認されないためには「Googleにオリジナルとして認知されること」が、最も有効な予防手段です。
具体的には、制作の段階から以下のような問題に気を付けましょう。
- 早い段階でGoogleサーチコンソールに登録・設定を済ませる
- クローラビリティの高いサイトを制作する
- クローラーの巡回を積極的に促す(インデックス登録リクエスト、robots.txtの活用など)
Googleは、情報のソース(情報源)はどこかを様々な条件で検証しますが、より早いタイミングで認識されることもオリジナルだと認識される要素の1つです。
クローラビリティを改善することで、早くインデックスされるように仕向け、自社サイトをオリジナルだと認識されれば、前述のような誤認を防ぐことができます。
Googleサーチコンソールだけでなく、クローラーとインデックスの関係性を理解しておくことはWEB制作において非常に重要な要素です。この記事では解説しきれませんので、詳しくは以下のページも合わせてご覧ください。
クローラーを徹底解説!重要なポイントとサイト向上の秘訣とは?
Googleインデックスの確認方法を解説!非表示の原因と対処法とは?
まとめ
この記事では、ミラーサイトがどんなものか、サイト運営者がミラーサイトに対してどんなことに注意すべきなのか、そのリスクなどについて説明してきました。
気付かぬうちに自社サイトの検索順位が下がった場合や検索結果に表示されなくなった場合は、ミラーサイトが何かしらの影響を与えているかもしれません。
また、意図せず外部リンクなどでペナルティをうけないよう、事前の対策や定期的な確認を行い、早期発見を心がけて下さい。
健全なミラーサイトを制作するためには、専門的な知識が関わります。サイト制作において不安がある方は、WEBコンサルティング・WEB制作会社である弊社の無料相談にてお話しいたしましょう。専門的な知見からあなたのサイトにあった戦略をご提供いたします。
執筆者:ヒトノート編集部
株式会社ヒトノテのオウンドメディア、WEBマーケティングの学習帳「ヒトノート -Hito note-」の編集部。
監修者:坪昌史
株式会社ヒトノテの代表取締役CEO。 エンジニアとしてキャリアスタートし、サイバーエージェントのSEO分析研究機関を経て、リクルートの横断マーケティング組織のマネージャー&全社SEO技術責任者を務める。その後、独立しSEOを中心としたクライアントの課題解決を行う。2017年、株式会社ヒトノテを創業し、様々な企業のウェブマーケティングの支援を行う。
おすすめの関連記事
─ 記事カテゴリから探す ─
元リクルートのSEO責任者へ無料相談
人気記事ランキング
-
2024.05.30
キーワードマーケティングのやり方とは?SEOの効果が見込める手順を徹底解説
-
2024.05.27
SEOにおけるURL設計のベストプラクティス
-
2024.04.25
ページネーションのSEOにおけるベストプラクティス
-
2024.04.22
E-E-A-Tとは?Googleが評価するコンテンツの基準や対策を解説
-
2021.12.06
レスポンシブデザインの最適ブレイクポイントとは?メディアクエリの書き方も解説
-
2021.07.09
Webコンテンツにおける正しい引用の書き方をマスターしよう!
-
2021.12.22
【徹底比較】さくらのクラウドとAWSの特徴・機能・料金の違いを解説
-
2022.02.21
「note」のユーザー数や年齢層を徹底分析!【2022年版】
-
2022.07.05
WordPressで301リダイレクトを設定する方法とは?初心者でも可能