2006年3月13日

[SpamAssassin-JP 97]日本語ルール整備プロジェクトのこと(Re: Wikiのこと)

** SpamAssassin メーリングリスト **
** 注意:このメールへの返信は SpamAssassin-jp へ行きます **
久保です。

> ToDo を列挙されていますが、各々の項目で実現可能性が異なります。

たしかに。いろいろ列挙しましたが、「できるところから始める」が基本スタン
スでかまわないと思います。


> | 1. スパムメールを収集する手段を作る: ヘッダを書き換えていない
> | スパムメールを集める方法を作る必要があるでしょう。同じスパ
> | ムを何通も収集してしまうこともあるので、重複を取り除く手段
> | も必要になります。
>
> これは SpamCop と同じことをやろうとする訳で、かなり大変ではないで
> しょうか。
> これ、後回しにしませんか。

同感です。課題としてはある、ということで。

> | 2. スパムメール分析ツール: スパムを分析してルール案を作るのは、
> | 人手がかかる作業になります。効率的に分析できるツールが必要
> | になるかもしれないし、ボランティアだけではまかなえないかも
> | しれません。いくつかのURIBLサイトがやっているように、提供
> | 方法によっては有償にすることなども視野に入れた取り組みが必
> | 要な気がします。
>
> 同上。

同意。

ただ、[SpamAssassin-JP 70]で滝澤さんが指摘された「わかち書きのノウハウ」
に関して、kakasiなりMeCabなりでわかち書きした結果を簡単に知ることができ
るといった程度なら、比較的簡単に作れて役立つかな、と思っています。

他にも、Receivedヘッダの中継経路をなどを解析して、headerルールを作るのに
役立ちそうなサマリー情報を作ってくれるツール、なんていうのがあったら便利
かな、などと思っています。

手がつけられるところから始める、ということでいいと思います。

> | 3. ルールのテストツール
>
> spamassassin -D --lint
> spamassassin -D -t

スパムやfalse positiveになったhamのサンプルを集める体制ができたとした
ら、夜間バッチなどで新しいルールを適用して効果を検証する、みたいなツール
が作れるんじゃないか、と思っています。でも、これもかなり大変なテーマだと
思います。当面はlintオプションなどの最小限のチェックから始めるのでいいと
思います。

> | 4. ルールの配布手段: Rules Du Jour という便利なツールがありま
> | す。このツールに対応することも含めて、いくつかの入手方法を
> | 提供することになると思います。
>
> 英語は不得手なんですが、本家 users-ML の投稿記事タイトルを眺めてる
> と、 http://www.rulesemporium.com/ って結構トラブル多いように見受
> けます。
> 最初はルールセットをテーマ毎に分割して web サーバに上げるだけでも
> 良いんじゃないでしょうか。

Rules Du Jourはwgetなどでルールを自動収集するためのラッパーです。ですか
ら、単一またはテーマ別のいくつかのルールをWebサーバにアップデートすれ
ば、当面は十分でしょう。Rules Du Jourを入れなくても利用できますから。

> 列挙されている項目の中であがっていないのが、ルールの吟味、取捨選択
> です。
>
> 日頃使っているルールを持ち寄って採用・不採用を検討する位なら、別に
> 何らかのツールを使わなくともできるのではないでしょうか。
> どのようなポリシーで作成するのかで大議論になりそうな気はしますが。

このことは、気づいてはいたのですが、課題として挙げるのを忘れていました。

ユーザ会として取り組む以上は、かなり最大公約数的に無難なポリシーを立てる
必要があるかと思います。それでも、たしかに個々のケースで議論になるでしょう。

あと、個々のルールについて履歴やコメントを管理すべきか、管理するならどう
管理するか、ということも考えないといけないと思っています。


--
----------------------------------------------------------------------
久保 元治 (株)サードウェア
Motoharu Kubo 274-0815 千葉県船橋市西習志野3-39-8
mkubo@xxxxx URL: http://www.3ware.co.jp/
Phone: 047-496-3341 Fax: 047-496-3370
携帯: 090-6171-5545/090-8513-0246
★弊社からのメールはZ-Linuxメールフィルタで全数検査しています★
--
SpamAssassin メーリングリスト
http://mm.apache.jp/mailman/listinfo/spamassassin-jp

投稿者 xml-rpc : 2006年3月13日 12:42
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/40935
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。