2006年9月12日

[Namazu-devel-ja 1214] Re: dump record data to NMZ.bug.info

寺西です。

NOKUBI Takatsugu wrote:
>
> At Sat, 09 Sep 2006 00:41:56 +0900,
> Tadamasa Teranishi wrote:
> > それと、インデックスにCRC等、チェック用のデータを含めたファーマット
> > にすることも必要かもしれません。

>
> 最終的にはそれがよいですね。互換性を考えるとNMZ.ii.crc等の別ファイル
> にするのがよさそうです。

HEAD は、従来のインデックスと互換性はありませんから、別ファイルにする
必要はないでしょう。(別ファイルにしてもいいですけど。)

> * BER encodingの値が正しいか
> * NMZ.wiが指す先は常にNMZ.wの改行の直後となっているか
> * NMZ.wが本当にソートされているか
>
> といったようなものを想定していました。

そこまでの機能はないですが、過去に NMZ.w, NMZ.wi の簡易チェックプログラ

nmzchkw.pl を投稿しています。

http://www.namazu.org/pipermail/namazu-users-ja/2005-November/000571.html

* check1
nul 文字、nul, lf, cr を除く制御文字、cr 文字、漢字 の個数を表示し、
nul 文字が含まれていなければ合格とします。

* check2
lf の個数と、NMZ.w の行数、NMZ.wi のサイズを sizeof(int) で割った数を
表示し、値が一致していれば合格とします。

* check3
NMZ.wi のオフセット値が NMZ.w の単語の長さ分増加しているかをチェック
し、正しければ合格とします。

間接的ですが「NMZ.wiが指す先は常にNMZ.wの改行の直後となっているか」
は、これでチェックできます。
--
=====================================================================
寺西 忠勝(TADAMASA TERANISHI) yw3t-trns@xxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E

_______________________________________________
Namazu-devel-ja mailing list
Namazu-devel-ja@xxxxx
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-devel-ja

投稿者 xml-rpc : 2006年9月12日 11:27
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/45818
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。