ユーザー通信があるシステムでは、スパム対策の問題が発生します。 ブログの投稿などにコメントする例を使用してシステムを構築することを検討してください。強制登録とキャプチャは使用しません。
ポイントシステムを使用
します
強制登録システムを導入することで解決できます。これは、このシステムに最初に登録しないと新しいコメントを追加できない場合です。 電子メールアドレスの確認が義務付けられているため、複雑になる場合があります。
よく使用される2番目の方法は、ボットからのチェック(CAPTCHA)の導入です。 なぜこのキャプチャが悪いのですか? たぶん彼女は私たちのブログをスパムから救うでしょう。 ただし、新しいコメントの追加は厳しく制限されます。 あなたが非常に有用なコメントを書くのに10秒費やし、この同じキャプチャに何が描かれているかを10秒把握すると、それは怠けたり、数字で推測できなくなる可能性があるからです。
アンチスパム(アンチボット)には、ブラックジャックとハッシュで複雑なフォームを作成するためのオプションがいくつかあります。 フォームを非表示にすることができます(リクエスト時にJavaScriptで表示することもできます)。 そして、スパマーにとって人生を困難にする他のテクニック。
ポイントシステム
サーバー上のメッセージを分析して、それがスパムかどうかを判断してみましょう。
効果的なブログコメントスパムブロッカーの構築方法に基づいて、
アウトコールドマンのアドバイス。 これは、いくつかのポイントをメッセージに追加または削除するルールのセットです。
システムが好むコメントごとに、ポイントを獲得します。 システムがメッセージを好まない場合、ポイントがかかります。 すべてのチェックの後、合計で1つ以上のポイントが取得された場合、メッセージは公開されます。 0の場合、スパムとしてマークされ、公開されます。 0未満の場合、安全に破棄できます。
スパムの種類
スパムは
自動および
手動です。
自動スパム (スパムボット)は最も簡単に検出できます。 メッセージをスパムとして定義する要因はいくつかあります。
手動スパムはより複雑です。 ユーザーが「正しい」データを手動でフォームに入力して送信します。 ただし、メッセージを分析して適切な決定を下すことはできます。
ルール
私のサイトでは、大量の自動スパムの問題をコメント、レビュー、その他のフォームで解決しました。 私のルールは記事のルールとは少し異なります。 それらは私のローカルタスクにより適合し、他のいくつかのルールが追加されました。
メッセージの分析方法について他のアイデアがある場合は、必ずタブレットに入れてください。
ルール | 値 | ポイント |
---|
メッセージ内のリンクの数 | ≥2 | リンクごとに-1 |
<2 | +1 |
メッセージの長さ | > 20文字でリンクなし | +2ポイント |
<20 | -1ポイント |
キーワード | バイアグラ、カジノ、その他の辞書の単語 | 単語ごとに-1ポイント |
メッセージごとのリンク分析 | リンクにゾーン.de、.pl、または.cnのドメインが含まれている場合(他のドメインがある場合があります) | -1ポイント |
これで、私が借りたルールは終わりました。 次は分析のために適応されるか、新しいルールになります。
フォームのUrlReferrerを確認し、実際にあるはずのURLと比較します | このパラメーターの違いにあまり注意を払ってはいけません。 | -2ポイントが異なる場合 |
ロシア語のテキスト サイトのオーディエンスはロシア語を話すため、名前や他のフィールドに他の言語を含めることはできません。 ロシア文字の割合を確認します | <10% | -2ポイント。 すべてが順調であれば+1 |
BBタグ 。 本文にBBタグがあるメッセージがありました。 これはサイトのエンジンによって提供されていないため、すぐにゴミ箱にそのようなメッセージがあります | [url]および[link] | -タグごとに2ポイント |
このアドレスからの以前のメッセージの分析 (電子メール、IPなど) | スパムに既にフラグが付けられている場合 | -1ポイント |
さらなる開発
スパムメッセージを分析し、新しいルールを追加することにより、作業中にシステムを開発できます。 これまでに実装できないアイデアがいくつかあります。
- 意味のないテキストの分析は 、メッセージに単語だけでなくランダムな文字が含まれている場合です。 問題は、これらが通常の単語ではなくランダムな文字であると判断することにあります。
- スパムとの闘いで「間違った」単語を定義する記事があります。これは、「正常」に見える単語をキャッチするのに役立ちます。
次に、他の可能なルールを収集して、システムがどのように機能するかを確認します。 現在、彼女は毎日最大500件のスパムメッセージをキャッチしています。 これらはすべて自動ボットであり、有害なことは何もしませんが、増加しているスパムのカウンターを見て、
システムが機能することを知ってい
ます 。
こちらのクラスを
ご覧ください