2006年12月12日

[SpamAssassin-JP 477] Re: SpamD on windows

** SpamAssassin メーリングリスト **
** 注意:このメールへの返信は SpamAssassin-jp へ行きます **
久保です。

>  構文解析を端折っている分、差はあると思いますが、遜色は
> 無いですか…。と言っても…ごにょごにょ…あんまし、書くと
> スパム出してる人にヒントになりそうなんで、やめときまふ…。
> という理由で、いつかは MeCab したいなー。と思いつつも

> 現実的な路線が先ですか…。

ベイズフィルタでは「日本語を適切に切り出してトークンに分割してやる」こと
が重要なので、その処理に一貫性があればトークナイズ手法はなんでもいいん
じゃないかと思っています。

MeCab、Kakasi、....を使ったSAマシンを何台か用意して、すべてに同じメール
を食わせて学習させ、同じメールを与えて判定させてみる....、といった比較を
すれば手法ごとの優劣が見えるのかもしれませんが....。

--
----------------------------------------------------------------------
久保 元治 (株)サードウェア
Motoharu Kubo 274-0815 千葉県船橋市西習志野3-39-8
mkubo@xxxxx URL: http://www.3ware.co.jp/
Phone: 047-496-3341 Fax: 047-496-3370
携帯: 090-6171-5545
★弊社からのメールはZ-Linuxメールフィルタで全数検査しています★
★ ブログを始めました http://blogs.itmedia.co.jp/ossway/
--
SpamAssassin メーリングリスト
http://mm.apache.jp/mailman/listinfo/spamassassin-jp

投稿者 xml-rpc : 2006年12月12日 12:33
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/50886
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。