2006年10月30日

[SpamAssassin-JP 431] Re: いよいよOSC

** SpamAssassin メーリングリスト **
** 注意:このメールへの返信は SpamAssassin-jp へ行きます **
さとうです。

On Sun, 29 Oct 2006 23:54:19 +0900
tateyan <tateyan@xxxxx> wrote:
Subject: [SpamAssassin-JP 428] Re: いよいよOSC

> とりあえずは手作業で目立つメールの中で数点の単語を抜き出して重み付けなの
> ですが、メールをサンプリングして単語の比率などからスパムに対応できる形に
> していけないかなぁと考え始めたところです。
> =>仕組み自体ベイジアンフィルタそのもののような気がしますが、メールを学
>   習するという形ではなく、ルールに記述する単語自体の重み付けのための情
>   報を分類できないかなぁと...

 実は自分も、これ出来ないかなあ、というのを考えていまして、今書いてるポ
リシーサーバの件が落ち着いたら、やってみたいと思っていました。

 各ルールを単語に見立てて、現在のスパム分類結果を基に、どのルールがどれ
だけの比率でマッチングするかをベイジアンフィルタに学習させるというイメー
ジです。
 もしくは、ベイジアンフィルタの適用順を全てのフィルタの後にして、ヘッダ
部分にマッチした各フィルタ毎の識別名を羅列しておけば、そのままベイジアン
フィルタを掛けると、単語を学習するように各フィルタ毎の名前も学習するんで
はないかな、とか。

 こういうルールファイルの自動重み付け機能が出来ると、適切なルールファイ
ルを書くための手間が、だいぶ簡素化されるのではないかと思っています。
 あれはもう、職人技の世界だもの。


--
佐藤 潔 (SATOH Kiyoshi) <satoh@xxxxx> http://d.hatena.ne.jp/stealthinu/

--
SpamAssassin メーリングリスト
http://mm.apache.jp/mailman/listinfo/spamassassin-jp

投稿者 xml-rpc : 2006年10月30日 17:30
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/48507
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。