2006年12月12日

[SpamAssassin-JP 478] Re: SpamD on windows

** SpamAssassin メーリングリスト **
** 注意:このメールへの返信は SpamAssassin-jp へ行きます **

 沖です。

> >  構文解析を端折っている分、差はあると思いますが、遜色は
> > 無いですか…。と言っても…ごにょごにょ…あんまし、書くと
> > スパム出してる人にヒントになりそうなんで、やめときまふ…。

> > という理由で、いつかは MeCab したいなー。と思いつつも
> > 現実的な路線が先ですか…。
>
> ベイズフィルタでは「日本語を適切に切り出してトークンに分割してやる」こと
> が重要なので、その処理に一貫性があればトークナイズ手法はなんでもいいん
> じゃないかと思っています。
>
 そうですね。逆に、意外なトークン単位に切り出されている方が
真髄を捕らえているって場合もありそうですよね。非日本語対応の
ベイズでも、そこそこ機能している所からも、それは伺い知れますか…。

 ほんしつてきには、かなのトークンがよわいと、かながだいぶぶんを
しめる"すぱむ"にたいしては(このぶんしょうのように)、にんしきりつが
おちるだろうという直感が私に働いてます。はずしてる可能性が
大きいですが…。


--
SpamAssassin メーリングリスト
http://mm.apache.jp/mailman/listinfo/spamassassin-jp

投稿者 xml-rpc : 2006年12月12日 13:01
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/50889
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。