お問い合わせ

ハッキングで感染した怪しいインデックススパムを最短で削除する方法

この記事は約6分で読めます。
本文は約3692文字です

サイトがハッキングされて、自分のサイトの検索結果に存在しないページが表示される、いわゆる検索ハイジャックの被害にあったことはありますか?

サイトが改ざんされて検索結果が汚染されることを、海外では『Japanese Keyword Hack』とか『 Japanese SEO Spam』と呼ばれています。

検索ハイジャックとは、自分のサイトに存在しない怪しげなECサイトのページがインデックスされ、自分のサイトの検索結果として表示される状態です。その検索結果をクリックすると怪しげなECサイトへリダイレクトされます。

サイトがハッキングされて、改竄されることで検索ハイジャックが発生します。サイトの改竄を修正して対策しても、インデックスされたページはなかなか削除されません。

  • なぜスパムインデックスはなかなか削除されないのか?
  • URLの『削除ツール』を一括指定したい
  • XMLサイトマップを使って不要なインデックスを速やかに削除したい
  • 404(Not Found)を返してもインデックスがなかなか消えない
  • 中古ドメインを購入したらインデックススパムに感染していた
目次

なぜスパムインデックスは削除されないのか?

Googleはクロールしたページが404になっているとインデックスから削除します。

スパムのインデックスは、ページが404になっていれば自然と削除されるので、放置しておけば良いとよく言われます。

しかし、実際にはなかなか不要なインデックスは削除されません。スパムインデックスは一瞬で登録されますが、インデックス削除はものすごい遅いのです。

Googleが再クロールを行わないと404であることを認識してくれないのですが、そもそもサイトにページが存在せず、サイトマップにもそのURLが存在しないので、Googleがなかなかクロールしないためです。

検索結果の『削除ツール』は1度に1つしかURLが指定できない

Googleには検索結果から不要なページを削除する『削除ツール』があります。それを利用すれば良さそうですが、数が多いとそれも難しいです。

なぜなら、削除ツールは1URLづつの指定となっており、ファイルなどで一括指定できないのです。

そうなると、インデックスが1万件とかを超えているとお手上げになります。

①『削除ツール』をCSVファイルで一括指定するツールがある

URL削除依頼を手動でポチポチやっていても拉致があきません。面倒な作業を自動化してくれるChrome拡張を作った素晴らしい人がいますので、その拡張機能をご紹介します。

WebMaster Tools – Bulk URL Removalとは?

CSV型式で削除URLを一括指定し自動化

Bulk URL Removal拡張機能は、削除するすべてのURLを含むCSVファイルを作成し、URL削除ツールの削除を自動化します。

CSVの形式

削除するURLはカバレッジのURL一覧から取得できます。

以下のURLを参考にして、CSV形式のファイルを作成します。

https://github.com/noitcudni/google-search-console-bulk-url-removal/#csv-format

使い方

緑のゴミ箱アイコンをクリックしてCSVファイルをアップロードし、一括削除ジョブを開始します。

②XMLサイトマップで不要なインデックスを削除する方法

不要なインデックスを高速に削除する方法として、XMLサイトマップを使う方法があります。

スパムインデックスのURLをXMLサイトマップに登録し、Googleのクロールを促し、404であることを知らせます。

インデックスされているURLをCSVでダウンロード

Google サーチコンソールのカバレッジを確認します。

[有効]だけを選び、インデックスされているものだけにします。

その後、インデックスされている全てのURLの情報をファイルでダウンロードします。

インデックスから削除したいURLのみをCSVに残します

インデックスされている全てのURLの情報には、インデックススパムと本物のURLが混ざっていると思います。

混ざっていても問題ないと思いますが、CSVから本物のURLは削除しておきます。

XMLファイルに変換します

URL一覧をXMLサイトマップ型式に変換してくれるオンラインサービスがあります。

このツールを使うと、削除したいURLだけが含まれるXMLサイトマップファイルを簡単に作ることができます。

CSVファイルには削除対象のURLしかありませんので、URL部分だけをコピーして、ツールに貼り付ければXMLファイルに変換できます。

XMLファイルをサーバーにアップロードします

XMLファイルをサーバーにアップロードして、パブリックにアクセスできるようにします。公開ディレクトリの直下にアップロードすれば大丈夫です。

XMLサイトマップをサーチコンソールに登録します

Googleサーチコンソールのサイトマップを開き、アップロードしたXMLファイル名を指定します。

これで、サイトに存在しないURLをGoogleが知ることができ、クロールし、404であることを伝えることが可能になりました。

あとは、カバレッジが減っていくことを期待して待つことになります。

③ 410ステータスを返してページ削除を伝える

存在しないページが404(Not found)を返してもなかなか削除されないことがあるので、410(Gone)を返すようにするとインデックスの削除が早まるようです。

WordPressの場合は、プラグインを使うと簡単です。

WordPress.org 日本語
410 for WordPress A plugin that sends HTTP 410 (Gone) responses to requests for articles that no longer exist on your blog.
  • プラグインをインストールして有効化
  • プラグインの設定画面から削除したいURLをコピペ(①)
  • Add entries to 410 listをクリック(②)すれば大丈夫です。
410 for WordPressの設定画面

中古ドメインを購入したらインデックススパムに感染していた

中古ドメインを購入してGoogle サーチコンソールに登録してしばらくたつと、サイトのページ数より極端に大きなカバレッジが現れるドメインがあります。

そういうドメインは検索ハイジャックに感染して、インデックススパムが大量にインデックスされていたのだと思います。感染して放置されるとサイトが無くなるので検索結果には表示されなくなります。しかし、ドメインが放出され、次にドメインを有効化すると、スパムインデックスがそのまま復活します。つまり、ドメインが無効になってもGoogleのインデックスは一括削除されず、緩やかに減っていくようなのです。

その場合は、そのまま使ってもいいことは一つもありません。この記事でご紹介した対策でインデックスをキレイに戻しましょう。

まとめ

検索ハイジャックされたサイトやドメインには大量のごみのインデックスが存在することになり、サイトの評価が激落ちします。その結果、新規作成した自分のページがインデックスされなくなります。

速やかに、不要なインデックスを削除するには削除ツールを使って一括削除したあと、削除用のXMLサイトマップを使うのが恒久対策になると思います。

よくある質問

なぜスパムインデックスはなかなか削除されないのか?

ページが存在しなくても、GoogleがそのURLをクロールしてくれないので404だと気が付きません。放置しておいても削除される速度はとても遅いです。

URLの『削除ツール』を一括指定したい

サーチコンソールからインデックス一覧をダウンロードし、CSVファイルを作成後、Chromeの拡張機能を使うと一括削除が可能です。

XMLサイトマップを使って不要なインデックスを速やかに削除したい

存在しないURLのXMLサイトマップを用意して、サーチコンソールに登録すれば存在しないURLへGoogleのクロールを促すことができます。

404(Not found)なのにインデックスがなかなか消えない

404だとGoogleが再度確認に来る可能性が残りますので、410(Gone)をhttpステータスとして返す方がインデックスが早く消えるようです。Wordpressの場合は、プラグインを使うのが簡単です。

この記事が気に入ったら
いいねしてね!

記事が役に立ったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

アフィリエイト歴10年以上のベテランアフィリエイター。アフィリエイトをこれから始めたい人や初心者が稼げるようになる有益な情報を提供できるように心がけています。

目次
TOPへ
目次
閉じる