2006年4月21日

[Namazu-devel-ja 1042] Re: そろそろNam azu 2.3.X 開発スタート

At Wed, 19 Apr 2006 15:43:24 +0900,
Tadamasa Teranishi wrote:
> 後者の場合であっても、nmzcat がそのままネットワーク対応になるでしょう
> から、ネットワーク先から取ってこれるようになるはずですので、そのことは
> 問題にはならないでしょう。

nmzcat http://... みたいなことができるようになるわけですか。なるほど。
以下のセンテンスは全面的に同意します。


> でも、ヒット数が多いと結構きつい処理ではないかと思います。
> サマリの生成は、1ページ分処理すれば良いのですが、フレーズ検索では
> 全件処理する必要がありますから。

CGIなどでの検索結果を出す分にはいいのかなとも思いますが、ページを進
めると実は検索結果数がちがった、みたいなことになると確かによくないです
ね。うーん。
Hyper EstraierもやっていることはNamazuのフレーズ検索に近くて、
bi-gram+フレーズハッシュみたいな感じで検索をしています。オプションでテ
キスト内の走査をして確実な結果を返すこともできるそうですけど。

フレーズとなると文字数も多いですし、確かに位置情報のほうがいいかもし
れませんね。
--
野首 貴嗣
E-mail: knok@xxxxx
knok@xxxxx / knok@xxxxx
_______________________________________________
Namazu-devel-ja mailing list
Namazu-devel-ja@xxxxx
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-devel-ja

投稿者 xml-rpc : 2006年4月21日 07:52
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/41336
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。