2008年2月26日

[SpamAssassin-JP 657] Re:日本語テストルールの自動作成スクリプト

** SpamAssassin メーリングリスト **
** 注意:このメールへの返信は SpamAssassin-jp へ行きます **

 沖です。

 今ごろバージョン 0.2 で、めったうちにあった
ham メールの報告です(ビジネスレター)。

バージョン 0.4 から生成されたルールは、賢くて
もっとスパムらしいワードの組み合わせになって
いるから、下記のような結果にはならないと思います。

BODY_JA_18, 18日
BODY_JA_ANNAI,
BODY_JA_BOSHU,
BODY_JA_CHIKI,
BODY_JA_CHUI,
BODY_JA_DOTO,
BODY_JA_GAZO, 衛星画像
BODY_JA_GORAN,
BODY_JA_HABAHIROI,
BODY_JA_HAISHIN, 次回の配信予定は
BODY_JA_KAIN, フォーラム会員
BODY_JA_KIBO, 大規模経営
BODY_JA_KOKAN, ご意見を交換
BODY_JA_MOKUTEKI,
BODY_JA_MURYO,
BODY_JA_NIKKI, 夢日記
BODY_JA_PUROFUIRU, (人物紹介文にて)
BODY_JA_SANKA,
BODY_JA_SANKASHA,
BODY_JA_SHASHIN, 航空写真
BODY_JA_SHOKAI, は下記で紹介されて
BODY_JA_TASU,
BODY_JA_TOKO 知床

 ただし、日本語スパムにも有効で、相当
キーワードがヒットしています。
おおむね、ham では 2-3 ワード
spam では 5 ワード以上といった感じです。

 続けて、0.4 の検証に入ろうと思います。


--
SpamAssassin メーリングリスト
http://mm.apache.jp/mailman/listinfo/spamassassin-jp

投稿者 xml-rpc : 2008年2月26日 14:31
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/70376
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。