2006年10月30日

[Namazu-devel-ja 1349] Re: mknmz の処理時間短縮

寺西です。

Yukio USUDA wrote:
>
> >> $ON_MEMORY_MAX 初期値(19回インデックス書きだしあり)
> >
> > 19回もインデックスを書き出すのは、ちょっと多いような気はします
> > ね。

>
> PDFがかなり含まれているのと、htmlのタグが結構多いためでは
> ないかと思っています。
> MS-Officeの文書などだと文書量の割にファイルサイズが大きいので
> 同様な傾向になるのではないでしょうか。

でしょうね。

> もう少し速くなりそうな改良案を作成してみました。
>
> sub hash ($) {
> my ($word) = @_;
>
> my $hash = 0;
> my $i = 0;
> $word = reverse($word);
> while(length($word)) {
> $hash ^= $Seed[$i & 0x03][ord(chop($word))];
> $i++;
> }
> return $hash & 65535;
> }

手元の環境では遅くなるようです。
$word が長いと reverse に時間がかかるからでしょう。
--
=====================================================================
寺西 忠勝(TADAMASA TERANISHI) yw3t-trns@xxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E
_______________________________________________
Namazu-devel-ja mailing list
Namazu-devel-ja@xxxxx
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-devel-ja

投稿者 xml-rpc : 2006年10月30日 08:18
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/48516
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。