2006年8月23日

[SpamAssassin-JP 357] Re:ヘッダーのマッチングルールについて

** SpamAssassin メーリングリスト **
** 注意:このメールへの返信は SpamAssassin-jp へ行きます **
滝澤です。

On Wed, Aug 23, 2006 at 10:19:55PM +0900,
舘山 聖司 wrote:

> 改めて滝澤様のルールを使わせて頂いてみて気が付いたのですが

> jp_rules-20060729.cf

これは久保さんのところで使っているルールですが、私のわかる範囲で。

> header TW_SUBJ_RAWJIS Subject =~ /(!\*|\033\$[B@]).*(!\*|\033\([BJ]!)/
>
> だとローレベルのJISを検知すると思っていたのですが
>
> なぜか全角の「!」が在るとこのルールにマッチングしてしまいます...

単に「!」はISO-2022-JPでは「!*」ですから、このルールではマッチすると思
います。

> エンコードされた状態だと =?ISO-2022-JP?B?GyRCISobKEI=?=
> なのでマッチング要素が無いと思うのですが、JISコードに展開された状態で
> チェックされているということはないでしょうか?
>
> エンコードされてないヘッダマッチングrawheaderとかって必要になるのかな
> なんて考えちゃいます

MIMEデコードされる前の状態のヘッダでパターンマッチさせるにはヘッダ名に
":raw"を付ける必要があります。
そのため、生JISを検出するためには次のように書きます。

header SUBJ_RAWJIS Subject:raw =~ /\e\$[B@]/


参考までに、私が書いたルールの中で:rawを使っているものを紹介します。
ISO-2022-JPの指示があるにもかかわらずデコードしてみるとISO-2022-JPの
エスケープシーケンスが無かった場合を検出します。
header __SUBJ_ISO2022JP Subject:raw =~ /=\?iso-2022-jp\?/i
header __SUBJ_ESC Subject =~ /\e/
header __FROM_ISO2022JP From:raw =~ /=\?iso-2022-jp\?/i
header __FROM_ESC From =~ /\e/
meta INVALID_ISO2022JP (__SUBJ_ISO2022JP && ! __SUBJ_ESC) || (__FROM_ISO2022JP && ! __FROM_ESC)


--
TAKIZAWA Takashi(滝澤 隆史)
http://www.emaillab.org/

--
SpamAssassin メーリングリスト
http://mm.apache.jp/mailman/listinfo/spamassassin-jp

投稿者 xml-rpc : 2006年8月23日 23:41
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/44460
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。