2009年9月 1日

[Namazu-users-ja 1171] Re:PDFのプロパティで文書名があっても本文自体に検索対象語が一語もない場合検索できない

寺西です。

Tadamasa Teranishi wrote:
>
> 森田 光貴 wrote:
> >
> > しかし現在の環境ではPDFのプロパティでの文書名があっても本文自体に
> > 検索対象語が一語もない場合

> > 検索できませんでした。
>
> ということはないはずです。

ないはずでしたが、NMZ.field.* の該当文書が空行の場合、バッファオーバー
ランが起こり、環境によっては「セグメンテーション違反」が発生します。

> 「セグメンテーション違反」が起こるということは、インデックスが
> 壊れているか、namazu コマンドに問題があります。
> いずれにしてもこれを改善しないことには、このファイルに限らず
> Namazu で正しい検索結果が得られません。

結論から言うと namazu, namazu.cgi コマンドに問題がありましたので、
ソースの修正を行いました。
CVS の最新ソースをコンパイルして使っていただければ、この問題は解決
するはずです。

また、とりあえずインデックスの方を手直ししてバッファオーバーランが
発生しないようにすることもできます。

$ cp NMZ.field.summary NMZ.field.summary.BK
$ sed 's/^[[:space:]]*$/ /' NMZ.field.summary.BK > NMZ.field.s
ummary
$ rfnmz .

ただし、インデックスが更新される度(mknmz を実行する度)にこの処理を
行う必要があります。

# sed 引数の空白部分は全角スペースです。
--
=====================================================================
寺西 忠勝(TADAMASA TERANISHI) yw3t-trns@xxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E

_______________________________________________
Namazu-users-ja mailing list
Namazu-users-ja@xxxxx
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja


投稿者 xml-rpc : 2009年9月 1日 00:20
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/88155
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。