2008年4月 6日

[Namazu-users-ja 1062] Re: gcnmz が非常な時間を要するようになった

野宮です.

ご面倒をお掛けし,申し訳ありません.m(_ _)m

In the Message;

Subject : [Namazu-users-ja 1061] Re: gcnmz が非常な時間を要するようになった
Message-ID : <47F8CECF.F39099BD@xxxxx>

Date & Time: Sun, 06 Apr 2008 22:23:27 +0900

[寺西さん] == Tadamasa Teranishi <yw3t-trns@xxxxx> has written:

小生>> 愕然としています.インデックスファイルのサイズが違い過ぎる,と.

寺西さん> やっと、

^^;;;

寺西さん>> たぶん、インデックスのサイズがその前後で随分変わったんではないかと
寺西さん>> 思いますよ。

寺西さん> この話に戻ってきましたが、だから gcnmz の処理時間が何倍にもなった
寺西さん> のでしょう。

寺西さん> という話を最初の方から言っているわけですけど...。

....<(_ _)>

小生の保有するファイル群の場合,</html>タグ以下を無視する,というFilterでは
駄目で,Content-Type: image/* なマルチパートを無視するというFilterにしなけ
ればならないようです.
つまり,ファイルに拠っては,元記事が複数ページに亘る,即ち,

<html>
<body>
本文1
</body>
</html>

<html>
<body>
本文2
</body>
</html>

Content-Type: image/*
[...]

という形式のものがあるからです.

全て 1ページなら -h オプションを使えるのですが.

ともあれ,Content-Type: image/* を無視するFilterが mailnews.pl にあるという
ところまでは解りました.
精進しなければ.....

---
野宮 賢 mail-to: nomiya @ galaxy.dti.ne.jp

「私たちが今日直面している化学物質の危険性に関する疑問に対し、通常の
科学的な正確さをもって答えようとすれば、たぶんさらに数十年を要するで
あろう。」 -- J. V. Rodricks --
_______________________________________________
Namazu-users-ja mailing list
Namazu-users-ja@xxxxx
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja

投稿者 xml-rpc : 2008年4月 6日 23:43
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/71850
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。