2007年5月 9日

[SpamAssassin-JP 553] Re: SpamAssassin version, 3.2.0

** SpamAssassin メーリングリスト **
** 注意:このメールへの返信は SpamAssassin-jp へ行きます **
沖です。
>
> > 注目すべきは
> >
> > * bug 4636: Add support for charset normalization,
> > so rules can be written in UTF-8 to match text

> > in other charsets.
> >
> > でしょうか?滝澤さんご苦労様です。
> > ありがたや〜ありがたや〜。
>
> これは違うのです。
> オリジナルのJohn Myersさんのパッチがコミットされています。
> 去年の1月に3.2系の開発ツリーにコミットされたようです。
> そのため、去年の3月から開発メーリングリストを見るようになった私は、
> 3.2.0のRCがでるまでパッチがコミットされていることに全く気が付かなかった
> という非常に間抜けな状況となっています。
>
 あれま、滝澤さんじゃなかったんですね…おおぼけ…(^^;
しかも、2006年1月の話じゃないっすか!
http://mail-archives.apache.org/mod_mbox/spamassassin-commits/200601.mbox/%3C20060126165126.24339.qmail@;xxxxx%3E

> ちなみに、実装されたnormalize_charsetはPerlの環境によっては有効に機能して
> いないという問題があったりもするのですが。
> 開発メンバーの誰もこの機能をテストしていないような気がします。
>

これによると
Perl 5.8.5 以降から実装された機能みたいですね。本家のリリース日は
2004-7-21
なんで、クローンによっては normalize_chaset の機能をまじめに実装
してないのもわかるような気がします。

> ということで、日本語対応パッチの作成方針を大幅に変更する必要が出ています。
> 実装されてしまった機能の変更は互換性のためできないのでnbodyテストやヘッダ
> テストの:utf8スイッチは使えないということです。
> normalize_charsetを有効にするとheaderテストもbodyテストも全てUTF-8で
> 評価しなければなりません。
>
 GAPPY_SUBJECT ルールとかに悩まされなくて済むので
これはこれで、割切ってしまえば、いいように思います。
とは言っても今回は、ちょっと大変そうですね…。

 時間がとれたら、ここら辺の機能を Windows 環境中心で
調査してみようと思います。
--
SpamAssassin メーリングリスト
http://mm.apache.jp/mailman/listinfo/spamassassin-jp

投稿者 xml-rpc : 2007年5月 9日 10:37
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/58291
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。