にしし ふぁくとりー(西村文宏 個人サイト)

Presented by Nishishi via Movable Type. Last Updated: 2017/06/21. 12:30:22.

投稿されたスパムの文章を読めなくするには

掲示板CGIに対するスパム投稿の多くは、スパマー(スパム投稿者)が手動でページにアクセスして手動でスパム文章を投稿しているのではなく、投稿ツールを使ってCGIに直接データを送ってるっぽいです。

スパマーにとっては、投稿先の掲示板がどんなものであるかはどうでもいいし、直前にどんな書き込みがあるか知る必要もないので、手軽な投稿ツールを使うのが楽で効率がよいわけです。

だから、掲示板のTOPとかに、「スパムはすぐに消すから書いても無駄ですよ。」とか警告文を書いておいたとしても、読まれることなんかないでしょうね。^^;;;

で、うちのブログにもスパムなコメントの投稿があるんですけど、これがかなり文字化けしているのです。
まあ、スパムは何も日本語だけで来るわけではありませんから、中国語とか韓国語とかでも来るわけで、そういう場合、大きく文字化けするのは当然です。

しかし。どうも、宣伝文に含まれるURLの先は、日本のサイトっぽいことがよくあります。日本のサイトということは、スパム本文は日本語で書かれているはずなのですが、なぜ文字化けするのでしょう?

実証してないのでただの推測なんですが、文字化けのパターンからして、UTF-8で記述されているページに対して、SHIFT-JISコードで文字列を送ってるから文字化けするんではないか、と思います。
文字化けしたときの感じ(漢字)が、どうもUTF-8とSHIFT-JISを誤ってデコードしたときに現れる文字っぽいので。

ということは、掲示板CGIの文字コードをUTF-8とか、SHIFT-JIS以外の文字コードにしておけば、スパム投稿の文字列が化ける可能性が高いんじゃないかと思います。

スパムが投稿されることに変わりはないわけですが、でも、いかがわしい日本文が表示されちゃうよりは、文字化けして読めない状態になっている方が、まだ精神的にマシではないかと思ったりするのです。

いかがなもんでしょう?

コメント

コメント数: 0件

コメント投稿欄 この日記に対するコメント投稿を歓迎します。



※本文中にURLは書けません。(書くと投稿が拒否されますのでご注意下さい。)

※ご投稿頂いた内容は、掲載前に管理者が確認する設定にしている場合があります。たいていは数日以内には表示されるはずですので、気長にお待ち願います。m(_ _)m

著者紹介


にしし(西村文宏)

にししでございます。本書いたり記事書いたりしてます。あと萌えたり。著書5冊発売中です(Web製作系4冊+小説1冊)。著書や記事は「西村文宏」名義。記事は主にAll Aboutで連載。本の最新刊は2011年3月に発売されたライトノベルでございますよ。

Twitter:にしし/西村文宏
にしし/西村文宏 on facebook にしし/西村文宏 on mixi にしし/西村文宏 on Google+ フォローはお気軽に!

にしし(西村文宏)連絡先
☕ コーヒーをおごる

著書一覧と詳細

関連する記事など

※下記には、本サイト内外の関連記事などが8本くらい自動で表示されています。

にししふぁくとりー Sakura scope内限定での主要なカテゴリ

--- 当サイト内を検索 ---