2006年9月22日

[Namazu-devel-ja 1250] Re: ptknamazu

臼田です

On 2006/09/22, at 0:06, Tadamasa Teranishi wrote:

>
> これって、nmzcat のようにテキスト変換を逐次行って取り出
> していると
> いうことかな。そのため mknmz の環境一式がいるわけですね。

>
> 現行の Namazu では、これはナイスな方法です。
> # nmzcat 凄し!! です。

もともとこういう使い方をしたかったので mknmz を分解して
いった
という経緯があったのですが、Perl/Tk のマルチバイト処理に問
題が
あったのと wxPerl がうまく動かない環境にあたってしまったりと
しばらく放置していました。

>
> ただ、さすがに検索結果を出力する際に変換していたのでは、
> 「Namazu-devel-ja#1224 検索精度の問題」とは比べられない
> ほど検索速度が
> 遅くなる可能性がありますので、HEAD では mknmz の際
> にプレーンテキスト化
> した本文全てをインデックスに保存する機能は必要になるでしょうね。
> (インデックスは肥大化しますが...。)
ちょっと試すかソースをみていただければわかりますが全文を取り出す
のは
タブを選択したときだけなので、通常はいつもの summary の表
示をしているので
検索速度には影響がないはずです。

nmzcat は遅いのですが、初期化に時間をとっている部分が大きいので
ptknamazu のような使い方をすればモジュールを全部読み込んだ後の
処理のみになるためそれほど不快ではありません。
とはいっても Scheme フィルタ等を実装していく上で本文すべて
保存するという
機能は必要になるでしょうし、CGI で使うにはサーバーでしょっ
ちゅう
ヘルパーアプリケーションが動くのはどうかとも思いますから本文を保
存は
したいですね。NMZ.field.gzippedcontent とかでそれなりに実
現はできるのでは
ないでしょうか。

>
> そうすると、ヘルパーアプリケーションがなくてもテキストで表示す
> ると
> いったこともできますし。(レイアウトを維持するのは難しい
> か...)

レイアウトが気になる場合はオリジナルを参照すればよいので
レイアウトの維持はあまり問題ではないと思います。

臼田幸生

_______________________________________________
Namazu-devel-ja mailing list
Namazu-devel-ja@xxxxx
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-devel-ja

投稿者 xml-rpc : 2006年9月22日 00:42
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/46463
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。