2006年9月14日

[Namazu-users-ja 822] Re: namazu/namazu.cgiで core-dump

寺西です。

報告ありがとうございます。

taguchi@xxxxx wrote:
>
> [現象]
> namazurcのMaxHitを上回る出現件数の検索語は、結果表示から無視されるのだと

> 思いますが、そうした語が検索語の先頭に現れ、かつ、連続した語となっている
> 場合、namazu,namazu.cgi双方とも、coreを吐いて死亡します。
>
> 具体的には、
> 「日本の歴史」
> の様な検索語、つまり、日本 の 歴史 というような複数の語からなる検索語
> で、「日本」と「の」がMaxHitを越えている状態であるならば、core を吐きます。

手元の Linux で試してみると、

$ namazu -f namazurc "日本の歴史" .
検索結果

参考ヒット数: { [ 日本 (ヒット数が多すぎるので無視しました) ] [ の (
ヒット数が多すぎるので無視しました) ] [ 歴: 0 ] [ 史: 0 ] :: 0 }

検索式にマッチする文書はありませんでした。

となり、問題はありませんでした。
core ダンプする理由はもう少し条件が必要なのかもしれません。

インデックスに含まれる「日本」や「の」の数はどれくらいかわかりますか?

そのインデックスが壊れている可能性はないでしょうか?
nmzchkw.pl で一度チェックしてみてください。
また、インデックスを削除して新規にインデックスを作成した場合でも
同様に問題が起きるでしょうか?

http://www.namazu.org/pipermail/namazu-users-ja/2005-November/000571.html
--
=====================================================================
寺西 忠勝(TADAMASA TERANISHI) yw3t-trns@xxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E

_______________________________________________
Namazu-users-ja mailing list
Namazu-users-ja@xxxxx
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja

投稿者 xml-rpc : 2006年9月14日 16:50
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/45946
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。