2006年4月24日

[SpamAssassin-JP 217]SpamAssassin-3.1.1日本語対応パッチ(案、その2)

** SpamAssassin メーリングリスト **
** 注意:このメールへの返信は SpamAssassin-jp へ行きます **
滝澤です。

SpamAssassin-3.1.1日本語対応パッチ(案、その2)を作ってみました。
http://www.emaillab.org/spamassassin/
その1から1ヶ月経っているので、いい加減途中経過をださないとダメだろうと
いうことでその2をアップロードしました。

まだ、十分にテストされていません。ていうか1時間前にできあがったばかり。
完全に人柱バージョンです。
ゴールデンウィーク中にブラッシュアップできたらいいなぁと希望的観測のものに
作業します。

----
test1からの変更点

- ルールnbodyを追加した。
例)
nbody NBODY_DEAI /出会い/
describe NBODY_DEAI deai
score NBODY_DEAI 1.0
- ヘッダのテストにおいて":utf8"を付けると、normalizeしたヘッダとのルールの
比較を行うようにした。
例)
header SUBJECT_MISHODAKU_UTF8 Subject:utf8 =~ /未承諾広告/
describe SUBJECT_MISHODAKU_UTF8 Subject contains mishodaku
score SUBJECT_MISHODAKU_UTF8 1.0
- normalizeのコンフィグ・スイッチを"normalize_charset"に変更した。
normalize_charsetの有無にかかわらず、従来のルールは互換性を保っている。
normalize_charsetが有効になることにより、新ルールnbodyとテストオプション
:utf8が有効になるだけである。
例)
normalize_charset 1
- 分かち書きプラグインを言語によって使い分けられるようにした。
- 分かち書きプラグインのパスを変更した。
後で宣言した方が有効になる。
例) v310.pre あるいは testplugin.cf に以下のどちらかを記述する。
loadplugin Mail::SpamAssassin::Plugin::Tokenizer::TokenizerKakasi
loadplugin Mail::SpamAssassin::Plugin::Tokenizer::TokenizerMeCab
----

--
TAKIZAWA Takashi(滝澤 隆史)
http://www.emaillab.org/

--
SpamAssassin メーリングリスト
http://mm.apache.jp/mailman/listinfo/spamassassin-jp

投稿者 xml-rpc : 2006年4月24日 21:14
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/41409
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。