2006年12月13日

[SpamAssassin-JP 482] Re: SpamD on windows

** SpamAssassin メーリングリスト **
** 注意:このメールへの返信は SpamAssassin-jp へ行きます **
滝澤です。

On Tue, Dec 12, 2006 at 01:01:06PM +0900,
OKI Miyuki wrote:

>  ほんしつてきには、かなのトークンがよわいと、かながだいぶぶんを

> しめる"すぱむ"にたいしては(このぶんしょうのように)、にんしきりつが
> おちるだろうという直感が私に働いてます。はずしてる可能性が
> 大きいですが…。

全く外していません。
精度は下がるが簡単に(外部のツールいらずで)導入できるという利点を重視しま
した。
N-gramでやるという方法もあるのですが、bayesのデータベースが異様に大きくなり
効率的ではないのが難点です。
中国語に対してもやるとしたらN-gramしかないような気がします。
中国語の形態素解析エンジンでオープンソースなものを以前探したのですが見つ
かりませんでした。

MeCabが使えればMeCabを使ってくださいというの本筋だと思います。

--
TAKIZAWA Takashi(滝澤 隆史)
http://www.emaillab.org/

--
SpamAssassin メーリングリスト
http://mm.apache.jp/mailman/listinfo/spamassassin-jp

投稿者 xml-rpc : 2006年12月13日 21:42
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/51009
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。