2006年8月12日

[SpamAssassin-JP 345] Re:shift-jisスパムが減った?

** SpamAssassin メーリングリスト **
** 注意:このメールへの返信は SpamAssassin-jp へ行きます **
こんにちは。松田陽一@三鷹です。

From: Taro Kawahara <tarokawa@xxxxx>
Subject: [SpamAssassin-JP 344] Re: shift-jisスパムが減った?
Date: Sat, 12 Aug 2006 09:50:24 +0900

> shift_jis文字列にだけヒットする実用的な正規表現が
> あれば、自分もスパムの蓄積の中からもっとたくさんの
> 同類なスパムを見つけられると思います。。。。

中国語とロシア語の文字セットに引っかかってしまいますが、
こんなものは如何でしょう。

body SJIS_C /(([\x81-\x9f\xe0-\xfc][\x40-\x7e\x80-\xfc])(?!([\xc0-\xdf][\x80-\xbf]|[\xe0-\xef][\x80-\xbf][\x80-\xbf]|[\xa1-\xfe][\xa1-\xfe]))){7,}/

# こいつをどうにかして精度を上げたいんですが、中国語と
# ロシア語の文字コード表、どっかにないでしょうか?
--
日本語spam展示博覧会開催中
http://www.flcl.org/~yoh/spam/jp/
松田 陽一(yoh)
mailto:yoh@xxxxx
http://www.flcl.org/~yoh/diary/
--
SpamAssassin メーリングリスト
http://mm.apache.jp/mailman/listinfo/spamassassin-jp

投稿者 xml-rpc : 2006年8月12日 11:41
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/43877
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。