2007年6月20日

[Namazu-users-ja 972] Re: base64のtext/plainとapplication/***の区別

中田と申します。いつもお世話になっております。
ご回答ありがとうございます。

Yukio USUDA wrote:
> --decode-base64 で添付ファイル等を展開する際に、
> 添付ファイルのファイル名をチェックしています。
> 添付ファイルの中にインデックス対象としたくないタイプ
> のファイルがあるのでしたら

> mknmzrc の $ALLOW_FILE から該当添付ファイルが
> 用いている拡張子を外すことで対応できるはずです。

当方の mknmzrc の設定は次のようになっております。
$ALLOW_FILE ="|\\d+|[-\\w]+\\.[1-9n]|.*\\.wem|.*\\.olf";
(検索対象としているメールファイルの拡張子は .wem または
  .olf です。)
mknmz 実行時には --mailnews と --decode-base64 を
オプションで付けております。

しかし、以下のようなケースですと添付ファイルに対しても
インデックスが作成されることを確認いたしました。

【メールの添付ファイル名】
config.xml
【本文の部分のヘッダ】
Content-Type: text/plain; charset=iso-2022-jp
Content-Transfer-Encoding: 7bit
【添付ファイルの部分のヘッダ】
Content-Type: application/octet-stream; name="config.xml"
Content-Transfer-Encoding: base64
Content-Disposition: attachment; filename="config.xml"

例えば、上記メールについて true というキーワードは
添付ファイル"config.xml"中にのみ出現しますが、
実際に true で検索すると上記メールもヒットします。
(本文中には true というキーワードは出現しません。)

以上のようなケースについて、当方の認識間違いなど
ありましたら教えていただけませんでしょうか?

以上、よろしくお願いいたします。
_______________________________________________
Namazu-users-ja mailing list
Namazu-users-ja@xxxxx
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja

投稿者 xml-rpc : 2007年6月20日 14:41
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/60464
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。