Webスパムとは何か?Webスパムの種類を解説

Webスパムとは

Webスパムとは、検索順位を不正に上げようとする有害な動作やコンテンツを含むページのことです。
検索エンジンにWebスパムと判定されると、検索順位が下がったりインデックス削除されたりする可能性が高まります。
2020年のGoogleのレポートでは、スパム行為のあるページが1日400億も検出されたと報告されています。

Webスパムの種類

「Google 検索の基本事項[1]旧Googleウェブマスター向けガイドライン(品質に関するガイドライン)」の「Google ウェブ検索のスパムに関するポリシー」にはWebスパムの種類が定義されています。
主なWebスパムには次のようなものがあります。

クローキング

クローキングとは、ユーザーと検索エンジンに対して異なるコンテンツを表示する手法です。
たとえば、検索エンジンには旅行に関するページを表示し、ユーザーには薬のディスカウントに関するページを表示します。このようなクローキングを施しておくと、「旅行」で検索したユーザーに薬の宣伝をすることができます。

しかし、Googleはユーザーが意図したとおりにページが表示されることを目指しているため、クローキングを施しているページはWebスパムとみなしています。

隠しテキストと隠しリンク

隠しテキスト隠しリンクは、検索エンジンの操作を目的として、人間のユーザーには見えないようにして配置されたコンテンツやリンクです。
Googleのポリシーに違反する隠しテキストと隠しリンクの例は次のとおりです。

  • 白い背景で文字色を白にする
  • テキストを画像の背後に置いて隠す
  • CSSを使用することでテキストを画面の外に配置する
  • フォントサイズや不透明度を0にする
  • 目立たない1文字のみをリンクにして隠す

隠しテキストと隠しリンクから得られる効果はクローキングと似ています。
たとえば旅行に関する隠しテキストや隠しリンクを薬の商品を紹介するWebページに設置しておくと、検索エンジンはそのWebページを旅行に関するページだと認識します。
その結果、旅行の情報を探しているユーザーに薬の情報を見せることができます。

先ほどのクローキングと同様、隠しテキストや隠しリンクもユーザーに意図に沿わないページが表示されることになるため、Webスパムとしています。

キーワードの乱用

キーワードの乱用とは、Webページにキーワードや数字を詰め込むことです。
不自然にリストやグループの形式を用いてキーワードを記載したり、関連性のない場所でキーワードを記載したりします。
例として、同じ単語や語句を不自然に感じられるほどに繰り返すキーワードスタッフィングが挙げられます。

リンクスパム

以下のような行為はリンクスパムと判定されます。

  • 検索順位を上げることを目的として行われるリンクの売買
  • 相互リンクのみを目的としたページの作成
  • 自動化されたプログラムやサービスを使用して作成された自分のサイトへのリンク

以前はWebサイトを大量に作り、そこに検索順位を上げたいWebサイトのリンクを貼ることで、検索順位を上げることができました。
しかし、現在ではリンクスパムと判定され、場合によっては検索順位を著しく落とすことになります。

独自の価値や付加価値のないコンテンツ

自動生成されたコンテンツや付加価値のないコンテンツはスパム行為とみなされます。
具体的には次のようなコンテンツが該当します。

  • 検索キーワードを含んでいるものの文章としては意味をなさない自動生成されたテキスト(ワードサラダ)
  • 無断複製されたコンテンツ
  • 商品説明やレビューを元のサイトからコピーするなど内容の薄いアフィリエイトページ

以前は他のWebサイトのコンテンツを無断転載したまとめサイトが検索の上位を占めるということもありましたが、現在では対策され、オリジナリティの高いWebページが検索上位に表示されるようになりました。

マルウェアや悪意のある動作

マルウェアは、ユーザーの同意がない、もしくはユーザーが気が付かないうちに有害なソフトウェアやウイルスをインストールといった悪意のある動作をするものです。
望ましくないソフトウェアには、ユーザーが望まないブラウザ設定を変更するものや個人情報を漏洩するものなどが該当します。
これらはユーザーエクスペリエンスに大きく悪影響を及ぼすため、スパム行為と判定されます。

誤解を招く機能

コンテンツやサービスに実際はアクセスできないにもかかわらず、ユーザーにアクセスできると思わせるよう意図的に作成されたサイトが該当します。
たとえば、PDFの統合などの特定の機能を提供すると装ってユーザーを誘導し、虚偽の広告を表示するサイトがあります。

不正なリダイレクト

リダイレクトとは、サイトにアクセスしようとリクエストされた URL とは別の URL にユーザーを移動させることです。
不正なリダイレクトでは、検索エンジンに示しているコンテンツタイプとまったく異なるコンテンツにユーザーをリダイレクトさせたり、特定のデバイスからのアクセスではスパムドメインにリダイレクトさせたりといった例があります。

ユーザー生成スパム

ユーザーによってサイトに追加されたスパムコンテンツもWebスパムと判定されて検索順位に影響を及ぼします。
サイト所有者はスパムコンテンツが追加されたことに気づかない場合が多くあります。
ユーザーに追加されるスパムコンテンツには、フォーラムのスレッドへのスパム投稿、ブログへのスパムコメント、スパムファイルのアップロードなどがあります。

まとめ

今回はWebスパムの種類を解説してきました。
Googleはユーザーが安心安全に、そして手軽にWebページを閲覧できるよう日夜検索エンジンの改良に励んでいます。
Webスパムの中には、リンクスパムやコンテンツの無断複製のように、一時は有効とされていたものもあります。
しかしユーザーの利便性を考えた結果、Googleは検索エンジンをアップデートさせ、リンクスパムなどの手法をWebスパムとして扱うようになりました。

この検索エンジンのアップデートの歴史を知れば、よりWebスパムの知識を広げることができるため、下記の記事にも目を通してみてください。

参考

1旧Googleウェブマスター向けガイドライン(品質に関するガイドライン)