2006年3月 1日

[SpamAssassin-JP 75] Re:SpamAssassin 3.1.0の日本語対応パッチ

** SpamAssassin メーリングリスト **
** 注意:このメールへの返信は SpamAssassin-jp へ行きます **
舘山です

MeCab のUTF-8の分かち書き環境に対応させて計測してみましたら
kakasiより若干速いようです


time spamassassin -L -t -r jisemail.eml
をそれぞれの環境で10回計測した結果の平均を出してみました

real user sys
kakasi 1.863s 1.747s 0.113s
MeCab 1.839s 1.723s 0.112s
-0.024s -0.024s -0.002s

メールの大きさやルールの多さなどで変わってくるかと思いますが
まぁ少しでも早い方が良いかなとも思います

Motoharu Kuboさんの
題名「[SpamAssassin-JP 74] Re: SpamAssassin 3.1.0の日本語対応パッチ」のメールからの引用です
> ** SpamAssassin メーリングリスト **
> ** 注意:このメールへの返信は SpamAssassin-jp へ行きます **
> 久保です。
>
> > はい、興味があるので協力したいと思います。
> > 一応、へっぽこPerl使いです。
>
> あ、Perl使い、大歓迎です。「へっぽこ」なんて書いておられますけど、すぐ
> 「バリバリ」に変わりますよ:-)
>
> # 私ももっと若くて自由な立場だったらオブジェクト指向の領域までバリバリや
> # りたいんですけど....
>
> > 昨日のパッチで確認しました。
>
> 安心しました。
>
> > 分かち書きに関しては色々な案を考えて試してみるしかないですかね。
>
> 今のパッチはkakasiを使っていますが、MeCabの方がコード変換を節約できると
> いうメリットがあります。一応MeCabでも動作は確認してありますが、パッチに
> まとめていないんです。数行書き換えるだけなんですけどね。
その通りでした(ほとんどMeCab-perlの例のままというのは置いといて)

--
彡彡从 たてやんっす
d□/□-b
ヽ"ー"丿

Key fingerprint = 5D56 8EA3 B9FE A721 4866 FB4A 0041 672C 08DD C33A


--
SpamAssassin メーリングリスト
http://mm.apache.jp/mailman/listinfo/spamassassin-jp

投稿者 xml-rpc : 2006年3月 1日 23:18
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/40807
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。