2007年7月15日

[SpamAssassin-JP 593] Re:PDF spam 対策 PDFText.pm

** SpamAssassin メーリングリスト **
** 注意:このメールへの返信は SpamAssassin-jp へ行きます **
舘山です

情報ありがとうございます

>
> (2) PDFText.pm というものを開発した人が出て来ました。

>
> http://support.ednet.ns.ca/SpamAssassin/PDFText.pm

を早速導入してみました

まずはダウンロード後
pdftotext_cmd
pdfinfo_cmd
の部分を自分の環境に合わせて修正
81行目
default => "/usr/local/bin/pdftotext", を
default => "/usr/bin/pdftotext",

93行目
default => "/usr/local/bin/pdfinfo", を
default => "/usr/bin/pdfinfo",

locate Mail/SpamAssassin/Plugin
でディレクトリをサーチして
cp PDFText.pm 見つかったPluginディレクトリ


/etc/spamassassin/ (または/etc/mail/spamassasin)ディレクトリ
のコンフィグ上に
loadplugin Mail::SpamAssassin::Plugin::PDFText

例では
body PDF_TO_TEXT eval:check_pdftext('stock')
と記述していて、これではpdf上に stockのキーワードが見つかった場合
スコア1 ということのようです


ルールの書き方がちょっと情報足りなくて、結局中身を見てみて
こんなルールの書き方のようです
check_pdftext('検出文字列:スコア','検出文字列:スコア' .... )

とりあえず
loadplugin Mail::SpamAssassin::Plugin::PDFText
body PDF_TO_TEXT eval:check_pdftext('stock:5','Expected:1','buy:0.5')
といったように書いて試してます

内部でそれぞれの文字列に対して AND とか OR の組み合わせが出来るとベスト
な気がしますが...


MATSUDA Yoh-ichi / 松田陽一さんの
題名「[SpamAssassin-JP 590] Re: PDF spam 対策」のメールからの引用です
> ** SpamAssassin メーリングリスト **
> ** 注意:このメールへの返信は SpamAssassin-jp へ行きます **
> こんにちは。松田陽一@三鷹です。
>
> 本家 ML では先月頃から活発に議論されています。
> users-ML は玉石混合なので、全然追いかけていませんが。(苦笑)
> 以下、 users-ML より。
>
> (1) rulesemporium.com に上がっています。
>
> リンク名 SARE - SpamAssassin Rules Emporium
> URL: http://www.rulesemporium.com/plugins.htm#pdfinfo
>
> (2) PDFText.pm というものを開発した人が出て来ました。
>
> http://support.ednet.ns.ca/SpamAssassin/PDFText.pm
>
> いずれも、私はまだ中身について吟味していません。

--
彡彡从 たてやんっす
d□/□-b <tateyan@xxxxx>
ヽ"ー"丿

Key fingerprint = 5D56 8EA3 B9FE A721 4866 FB4A 0041 672C 08DD C33A


--
SpamAssassin メーリングリスト
http://mm.apache.jp/mailman/listinfo/spamassassin-jp

投稿者 xml-rpc : 2007年7月15日 00:20
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/61628
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。