2006年3月 7日

[SpamAssassin-JP 84] Re:SpamAssassin 3.1.0の日本語対応パッチ

** SpamAssassin メーリングリスト **
** 注意:このメールへの返信は SpamAssassin-jp へ行きます **
滝澤です。

On Mon, Mar 06, 2006 at 11:55:10PM +0900,
たてやん wrote:

> 久保様も記述されてますがMeCab は./configure 時に --with-charset=utf8 

> を指定することでデフォルトのコードをutf-8 に出来ます 
> こうするとさらに
> my $utf8= Encode::decode("utf-8",$str);
> は不要になります

えっと、一応、MeCabと辞書は共にutf8指定でコンパイルしています。

キャラクタエンコードする必要があるのかなと思って、decode()したのですが、
パッチの他の部分を読むと、バイトエンコード(生UTF-8)で扱っているので
不要ということですね。

Perl 5.8以降に限定すれば、キャラクタエンコードで処理するのもよいのかな
と思ったりもします。
5.6に対する互換性や処理速度も調べないといけないですが。

--
TAKIZAWA Takashi(滝澤 隆史)
http://www.emaillab.org/

--
SpamAssassin メーリングリスト
http://mm.apache.jp/mailman/listinfo/spamassassin-jp

投稿者 xml-rpc : 2006年3月 7日 01:47
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/40877
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。