Semalt:Google Analyticsでリファラースパムをブロックするための優れたガイド

Semaltの専門家であるNik Chaykovskiyは、紹介スパムがWebマスターが現在直面している問題の1つであることを保証します。状況は何年にもわたって悪化してきており、誰かが紹介スパムを作成することで多くのお金を稼いでいることを意味します。
ゴーストと紹介スパム
スパムがGoogleアナリティクスのレポートに登場しました。スパマーは、システムの脆弱性を探して、Webサイトのデータレポートに表示されるようにします。彼らは、WebマスターがWebサイトにアクセスして、レポートに含まれている理由を確認するほどの好奇心をかきたてられることを期待してこれを行います。問題は、トラフィックが増加しないことです。彼らはボットなので、彼らもそれを作りません。 Google Analyticsで使用されるJavaScripトラッキングコードを使用して、訪問があったことを示す通知を作成します。これらは、直帰率やエンゲージメントの分析に使用されるその他の要素などの重要な統計を歪めます。正確なデータが必要な場合、特にマーケティングの決定にそれを利用している場合は、紹介スパムをブロックすることが不可欠です。
特にスパマーは非常に速く動作し、スパムのヒット率とソースを増加させるため、紹介スパムをブロックすることが難しくなります。つまり、ウェブマスターはこれらのソースを排除してブラックリストに載せる努力を改善する必要があります。これは、正当なトラフィックがあまりない新しいサイトを持っている人にとって特に厄介です。そのようなサイトでのスパム率の増加は、それが受け取る毎日のヒットよりもさらに大きいかもしれない、より多くの歪度を示します。
簡単ですか?
1ページは、1回の訪問としてレコードをロードします。ゴーストスパマーは、Google Analyticsトラッキングコードを使用して、トラフィックデータをレポートに直接送信し、訪問を偽造します。サーバー上の単一ページをどこかにロードするのに0.001秒かかる場合があります。しかし、彼らはこれらすべての偽の訪問を、他の多くのサイトのGoogleアカウントに100以上強制した可能性があります。単一のホストを購入するのは非常に簡単です。スパマーがROIを確信している限り、スパマーができる多くの被害があります。

不足しているソリューション
一部の手法は非常に高度で、紹介スパムをブロックするために採用されたソリューションが機能しない場合があります。それらの1つはDarodarと呼ばれる神秘的なオンラインサービスです。次の方法では、GAからそれをクリアできませんでした。
- .htaccessファイル。ゴーストスパムがサイトに触れないため、機能しません
- 参照除外リスト。アップデートがありません。
- 除外フィルター。将来のスパムにのみ焦点を当て、過去のスパムデータベースにはさかのぼらないため、これは古い方法です。
除外フィルターは、Darodarの紹介スパムをほぼ排除するようになりました。その唯一の制限は、一定して一貫して更新された紹介スパマーリストがないことです。
ミッシングパズルピース
参照データとゴーストデータを識別してブロックする実用的なソリューションは、非常に更新され、より広範なデータベースから取得され、過去の情報に遡及する必要があります。最適なソリューションの3つの要素に基づいて、機能するものを次に示します。
ステップ1:セグメントを使用してスパムを除外する
データを永続的に変更するわけではないため、セグメントを使用することをお勧めします。フィルターの使用中に実際のリファラーを誤って除外した場合、それらを元に戻す方法はありません。データが存在する期間が長くても、セグメントを使用して古いデータを構築することは可能です。さかのぼって適用することもできます。
ステップ2:除外リストの維持
Slackは、ウェブマスターが参照ソースを監視するために使用できるツールです。新しい紹介についてユーザーに通知し、プロンプトを表示します。疑わしい紹介ソースをホワイトリストに登録するかブラックリストに登録するか。
1. Slackがすべての紹介を受け取り、
2. PHPを使用してすべての結果をカウント順にソートし、最終的なリストをWebマスターにループして、見慣れたものがあるかどうかを確認します。そうでない場合、
3.疑わしいすべてのスパムをスラックチャネルに転送し、ユーザーにホワイトリストまたはブラックリストの選択肢を提供します。どちらのオプションを選択しても、ステップ4に進みます。

4.選択の確認として判定を検証するページにリダイレクトします。
5. Slackは、識別されたすべてのスパマーをデータベースに保存してロックします。
6.クリーンなデータの最終的な表示は正規表現形式になります。コピーしてGoogleアナリティクスに貼り付けます。
Slackにより、Webマスターは除外リストを少なくとも1日に5回更新できます。
実際には、いくつかのソリューションが機能します。
これは実績のある方法ですが、ウェブマスターが他の手法で補足すると、すべてのベースをカバーできるようになるため、さらに効果的です。上記のソリューションに加えて:
- Google Analyticsに既知のボットとスパイダーを除外するように促すチェックボックスをクリックし、
- 「ホスト名フィルターを含める」を適用します。
- Cookieを使用する
上記の包括的フィルターは時々効率的ですが、次の理由により長期的には最良のソリューションではありません。
- ホスト名のなりすましは難しいことではなく、分析スパマーはこれを脆弱性としてますます使用しています。
- 設定が間違っていると、実際の参照元が除外される可能性があります。