かなり撃退できました。
Posted by momokuri on 2006 7月 15 in b2evolution
本サイトでも活用しているSpamDeluxe機能を強化して、閾値以上のトラックバック・コメントが来た場合には、コメントを自動的にdeprecatedにフラグ付けし、スパムの可能性のあるドメインとして管理した上で、最近のコメント一覧への表示をしない、というロジックにしました。
エセキャプチャ機能、ポテンシャルスパマー自動検出機能、自動deprecate機能の組合せで、この1週間にくるコメントスパム・トラックバックスパム・abuseのうち、10件程度がすり抜けただけで、対処できました。
大垣さんのところでは2500件もきて、大変そうですが。
この10件ですが、
- BLOGのスパムに対する耐性をロボットがチェックするための、keywordのみのtrackback打ち込み
- affilicateで商売しているサイトのSEO対策?と思われる広告だけのtrackback
- 1、2件だけのabuse trackback
になります。
ひとつめの手法は、WikiPediaの解説 Spamdexingや、Comment spam number mysteryがとても参考になります。
今後の対処ですが、コメントスパムナンバー対策として、latinで単語として意味を成さない語句を検出、potential spamming keywordとしてDBにて蓄積して、閾値判定するロジックを入れたいと思います。閾値判定はすでに実装済みですから、スパムナンバーをどうやって検出するか、というのが技術的課題です。
そのほかには、comment key機能の実装です。
This entry was posted by momokuri and filed under b2evolution.
もうひとつありました。
記事を入力可能なメンバーが投入したURLについて、現在はコメントと同様にPotential SPAMの候補になってしまうのを、対象外にする、というのもあります。
始めから、authorisedに入れてしまうという考えもありますが、たとえばだれでも会員になれるようなblogサイト運営をしているケースを考えると、会員になって記事にblogspamのURLを投入することでwhitelistに登録できることになり、よくありません。