2006年11月 1日

[SpamAssassin-JP 445] Re:ルールセットのベイジアンフィルタでの学習(Re: ルールセットについて)

** SpamAssassin メーリングリスト **
** 注意:このメールへの返信は SpamAssassin-jp へ行きます **
さとうです。

On Tue, 31 Oct 2006 23:43:47 +0900
Motoharu Kubo <mkubo@xxxxx> wrote:
Subject: [SpamAssassin-JP 443] Re: ルールセットのベイジアンフィルタでの学習(Re: ルールセットについて)

> たとえば私のサンプルルールセットでは、「だんせい」、「じょせい」、「であ
> い」(ホントは漢字だけどあえてひらがなで書いてます)の単体には低いスコアし
> か与えていませんが、「これらが全部出現したら」というMETAルールに高いスコ
> アを与えています。

 久保さんも、館山さんと同じことを考えてらしたのですね。

> さとうさんは(もうひとつの)ベイズフィルタを分析ツールにと考えておられるよ
> うですが、私はまだどんなツールが考えられるのか、そこまで至っていないです。

 僕のは、ルールセット各々のポイント付けの動的自動化をベイジアンフィルタ
で行うという案です。

 こうすると例えば、自動学習の結果、spamhausでマッチしていたら99%の確率
だがsorbsでマッチしてても95%だとか、DNSBLごとの正確な信頼度が設定されて
いったりもすると思うのです。


--
佐藤 潔 (SATOH Kiyoshi) <satoh@xxxxx> http://d.hatena.ne.jp/stealthinu/

--
SpamAssassin メーリングリスト
http://mm.apache.jp/mailman/listinfo/spamassassin-jp

投稿者 xml-rpc : 2006年11月 1日 00:51
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/48533
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。