2010年1月 4日

[SpamAssassin-JP 723] Re:FH_DATE_PAST_20XX (was Re: あけましておめでとうございます)

** SpamAssassin メーリングリスト **
** 注意:このメールへの返信は SpamAssassin-jp へ行きます **
岩本といいます。

On Mon, 04 Jan 2010 11:51:47 +0900 (JST)
MATSUDA Yoh-ichi / 松田陽一 <yoh@xxxxx> wrote:

> From: Tokio Kikuchi <tkikuchi@xxxxx>

> Subject: [SpamAssassin-JP 720] あけましておめでとうございます
> Date: Mon, 04 Jan 2010 08:58:58 +0900
>
> > 皆様、新年あけましておめでとうございます。
>
> 本年もどうぞ宜しくお願いします。

あけましておめでとうございます。


> > 年があけたとたん、Spam Score が高くなって、あれっと思ったら、
> > こんなことがあるんですね。
> > http://jvnrss.ise.chuo-u.ac.jp/csn/index.cgi?p=SpamAssassin%A4%CEFH_DATE_PAST_20XX

情報、ありがとうございます。気が付いていなかったので、大変助かりました。


> げっ、やべっ、と思って今しがた spam ディレクトリをチェックしま
> したが、幸い FH_DATE_PAST_20XX で false positive された ham は
> 見当たりませんでした。

自分も慌ててチェックしましたが、false positive はなかったようです。
# 4.9 なんてギリギリなものは有りましたが


> 日本人である以上、以下のルールは無効化するか、スコアを低めにし
> ておいた方がよいと思います。
>
> score MISSING_SUBJECT 0
> score FROM_EXCESS_BASE64 0
> score TVD_SPACE_RATIO 0

自分の所でも、これらは無効化しています。
日本語特有の問題としては、他にも

WEIRD_QUOTING
□が iso-2022-jp だと "" になるので引っかかりやすい

FM_FRM_RN_L_BRACK
"場" などが iso-2022-jp で > を含むので引っかかる

FH_FROMEML_NOTLD
なぜかセブンイレブンからのメール(下記のようなFrom)が引っかかる
From: =?ISO-2022-JP?B?GyRCJTslViVzGyhCLRskQiUkJWwlViVzJU0bKEI=?= =?ISO-2022-JP?B?GyRCJUMlSBsoQiAbJEIlYSE8JWslXiUsJTglcxsoQg==?= <mag@xxxxx>

辺りも無効化しています。

で、便乗して質問です。
上記のルールを単純に無効化するのも悲しいので、日本語(iso-2022-jp)なメールに
対してだけ無効化したいのですが、どうするのがスマートな方法なんでしょうか?

とりあえずは、local.cf に

header __ISO2022JP_CHARSET Content-Type =~ /charset="?iso-2022-jp"?/i
#score WEIRD_QUOTING 2.799 2.796 1.428 1.396
meta WEIRD_QUOTING_JP WEIRD_QUOTING && __ISO2022JP_CHARSET
describe WEIRD_QUOTING_JP Disable WEIRD_QUOTING in Japanese message
score WEIRD_QUOTING_JP -2.799 -2.796 -1.428 -1.396

などと書いて、日本語の時は加算された分を引くようにしているのですが、
Status に両方のルールに引っかかった事がのるのがちょっと気にくわないです。
もっとスマートな方法はないでしょうか?

--
いわもと こういち(sue@xxxxx/sue@xxxxx/sue@xxxxx)
# なるようになれ、明日もイケイケ♪
--
SpamAssassin メーリングリスト
http://www.apache.jp/mailman/listinfo/spamassassin-jp


投稿者 xml-rpc : 2010年1月 4日 20:33
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/92042
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。