この記事は約6分で読めます。
本文は約3692文字です
ハッキングで感染した怪しいインデックススパムを最短で削除する方法
サイトがハッキングされて、自分のサイトの検索結果に存在しないページが表示される、いわゆる検索ハイジャックの被害にあったことはありますか?
サイトが改ざんされて検索結果が汚染されることを、海外では『Japanese Keyword Hack』とか『 Japanese SEO Spam』と呼ばれています。
検索ハイジャックとは、自分のサイトに存在しない怪しげなECサイトのページがインデックスされ、自分のサイトの検索結果として表示される状態です。その検索結果をクリックすると怪しげなECサイトへリダイレクトされます。
サイトがハッキングされて、改竄されることで検索ハイジャックが発生します。サイトの改竄を修正して対策しても、インデックスされたページはなかなか削除されません。
- なぜスパムインデックスはなかなか削除されないのか?
- URLの『削除ツール』を一括指定したい
- XMLサイトマップを使って不要なインデックスを速やかに削除したい
- 404(Not Found)を返してもインデックスがなかなか消えない
- 中古ドメインを購入したらインデックススパムに感染していた
なぜスパムインデックスは削除されないのか?
Googleはクロールしたページが404になっているとインデックスから削除します。
スパムのインデックスは、ページが404になっていれば自然と削除されるので、放置しておけば良いとよく言われます。
しかし、実際にはなかなか不要なインデックスは削除されません。スパムインデックスは一瞬で登録されますが、インデックス削除はものすごい遅いのです。
Googleが再クロールを行わないと404であることを認識してくれないのですが、そもそもサイトにページが存在せず、サイトマップにもそのURLが存在しないので、Googleがなかなかクロールしないためです。
検索結果の『削除ツール』は1度に1つしかURLが指定できない
Googleには検索結果から不要なページを削除する『削除ツール』があります。それを利用すれば良さそうですが、数が多いとそれも難しいです。
なぜなら、削除ツールは1URLづつの指定となっており、ファイルなどで一括指定できないのです。
そうなると、インデックスが1万件とかを超えているとお手上げになります。
①『削除ツール』をCSVファイルで一括指定するツールがある
URL削除依頼を手動でポチポチやっていても拉致があきません。面倒な作業を自動化してくれるChrome拡張を作った素晴らしい人がいますので、その拡張機能をご紹介します。
WebMaster Tools – Bulk URL Removalとは?
CSV型式で削除URLを一括指定し自動化
Bulk URL Removal拡張機能は、削除するすべてのURLを含むCSVファイルを作成し、URL削除ツールの削除を自動化します。
CSVの形式
削除するURLはカバレッジのURL一覧から取得できます。
以下のURLを参考にして、CSV形式のファイルを作成します。
https://github.com/noitcudni/google-search-console-bulk-url-removal/#csv-format
使い方
緑のゴミ箱アイコンをクリックしてCSVファイルをアップロードし、一括削除ジョブを開始します。
②XMLサイトマップで不要なインデックスを削除する方法
不要なインデックスを高速に削除する方法として、XMLサイトマップを使う方法があります。
スパムインデックスのURLをXMLサイトマップに登録し、Googleのクロールを促し、404であることを知らせます。
インデックスされているURLをCSVでダウンロード
Google サーチコンソールのカバレッジを確認します。
[有効]だけを選び、インデックスされているものだけにします。
その後、インデックスされている全てのURLの情報をファイルでダウンロードします。
インデックスから削除したいURLのみをCSVに残します
インデックスされている全てのURLの情報には、インデックススパムと本物のURLが混ざっていると思います。
混ざっていても問題ないと思いますが、CSVから本物のURLは削除しておきます。
XMLファイルに変換します
URL一覧をXMLサイトマップ型式に変換してくれるオンラインサービスがあります。
このツールを使うと、削除したいURLだけが含まれるXMLサイトマップファイルを簡単に作ることができます。
CSVファイルには削除対象のURLしかありませんので、URL部分だけをコピーして、ツールに貼り付ければXMLファイルに変換できます。
XMLファイルをサーバーにアップロードします
XMLファイルをサーバーにアップロードして、パブリックにアクセスできるようにします。公開ディレクトリの直下にアップロードすれば大丈夫です。
XMLサイトマップをサーチコンソールに登録します
Googleサーチコンソールのサイトマップを開き、アップロードしたXMLファイル名を指定します。
これで、サイトに存在しないURLをGoogleが知ることができ、クロールし、404であることを伝えることが可能になりました。
あとは、カバレッジが減っていくことを期待して待つことになります。
③ 410ステータスを返してページ削除を伝える
存在しないページが404(Not found)を返してもなかなか削除されないことがあるので、410(Gone)を返すようにするとインデックスの削除が早まるようです。
WordPressの場合は、プラグインを使うと簡単です。
- プラグインをインストールして有効化
- プラグインの設定画面から削除したいURLをコピペ(①)
- Add entries to 410 listをクリック(②)すれば大丈夫です。

中古ドメインを購入したらインデックススパムに感染していた
中古ドメインを購入してGoogle サーチコンソールに登録してしばらくたつと、サイトのページ数より極端に大きなカバレッジが現れるドメインがあります。
そういうドメインは検索ハイジャックに感染して、インデックススパムが大量にインデックスされていたのだと思います。感染して放置されるとサイトが無くなるので検索結果には表示されなくなります。しかし、ドメインが放出され、次にドメインを有効化すると、スパムインデックスがそのまま復活します。つまり、ドメインが無効になってもGoogleのインデックスは一括削除されず、緩やかに減っていくようなのです。
その場合は、そのまま使ってもいいことは一つもありません。この記事でご紹介した対策でインデックスをキレイに戻しましょう。
まとめ
検索ハイジャックされたサイトやドメインには大量のごみのインデックスが存在することになり、サイトの評価が激落ちします。その結果、新規作成した自分のページがインデックスされなくなります。
速やかに、不要なインデックスを削除するには削除ツールを使って一括削除したあと、削除用のXMLサイトマップを使うのが恒久対策になると思います。
よくある質問
