2006年9月14日

[Namazu-users-ja 824] Re: namazu/namazu.cgiで core-dump

田口です。

> となり、問題はありませんでした。
> core ダンプする理由はもう少し条件が必要なのかもしれません。

うーん、ちょっと厭んな現象を持ち込んでしまったかもしれません_o_

> インデックスに含まれる「日本」や「の」の数はどれくらいかわかりますか?


調べました。
日本 : 10714
の : 34318
歴史 : 1437
でした。

> そのインデックスが壊れている可能性はないでしょうか?
> nmzchkw.pl で一度チェックしてみてください。

ここで初めて、nmzchkw.plの存在を知りました。ごっつい便利ですね。
結果ですが、

# nmzchkw.pl
==============================
check 1
==============================
nul : 0
control : 0
cr : 0
0x80 - 0xff : 245014
ok
==============================
check 2
==============================
lf : 962754
NMZ.w: words : 962754
NMZ.wi: words : 962754
ok
==============================
check 3
==============================
ok
==============================
All check passed.

壊れていない、様です。

> また、インデックスを削除して新規にインデックスを作成した場合でも
> 同様に問題が起きるでしょうか?

これは、現在試している最中です。総文書数が4万件以上あり、今、3万件
目まできた所です。
多量のPDFが含まれているので、処理にごつい時間が掛かるです。
_______________________________________________
Namazu-users-ja mailing list
Namazu-users-ja@xxxxx
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja

投稿者 xml-rpc : 2006年9月14日 17:31
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/45948
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。