2007年10月 6日

[Namazu-devel-ja 1641] Re: mknmz --no-heading-summary オプションの仕様について

寺西です。

Yukio USUDA wrote:
>
> 結果的に HEAD で追加した部分が元の仕様と同じ動作を
> 満たしていなかったという結果でしたが

それだけでなくて、HEAD, development-2-1 の動きは少々妙な気はします。

# まだちゃんと調べてはいませんが。

なお、HTML::Parser 版は全般的にまだ十分テストされていませんが、
パース処理以外の振る舞いは、stable-2-0 と一致しないと何かと
トラブルの元ですので、あわせるようにしましょう。

その上で、仕様変更が望ましいものは、変更箇所を明確化して変更する
のが良いでしょう。

> On 2007/10/06, at 1:07, Tadamasa Teranishi wrote:
>
> 運用上 <Hn>〜</Hn> に見出し以外の文章が入っているも
> のを
> 検索したい場合もあるでしょうから
> 文字列が長い場合には
> 要約や重み付けには含めないという仕様はもっともですが、
> 本文中には含めるような改善をすべきと思います。

本文中に含めるという仕様もありだとは思います。

ただ、その場合は検索はできるけれども、

-x なし、$INVALID_LENG を超えない場合、heading
-x なし、$INVALID_LENG を超える場合、本文
-x あり、$INVALID_LENG を超えない場合、本文
-x あり、$INVALID_LENG を超える場合、本文

となり、heading が短い場合は、いずれのケースでも要約に現れます。
(また、heading が短い場合というのはしばしば起こります。)

これは、-x が事実上、無力化されます。(重みが変わる程度)
こちらを立てれば、あちらが立たずといった、それはそれでいいのかと
いう話です。
# たぶん、検索の方が重要という意見が多いとは思うけど。

根本的には -x オプションの仕様であるとか、要約作成部分の処理の問題
で、大幅に変えないといけない話になるので、2.0では手を出さないのが
良いかなと思っています。

まぁ、-x なし、$INVALID_LENG を超える場合、本文 というのぐらいの
修正はいいかもしれません。

> 理不尽な仕様等は必要性を議論して整理していくべきかと思います。

2.2 では Yes です。が、2.0 では No です。
これは今回の件以外でもです。

2.0 に関してはバグフィックス以外の変更は極力行わない方向で進めて
います。また、バグフィックスであってもセキュリティ上の問題以外は
大幅な修正が必要なものも避けたいと思います。(2.0は開発終了)
# といいながら、たまに手を加えてしまってますけど...。

一方で 2.2 での議論は活発にしましょう。
--
=====================================================================
寺西 忠勝(TADAMASA TERANISHI) yw3t-trns@xxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E

_______________________________________________
Namazu-devel-ja mailing list
Namazu-devel-ja@xxxxx
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-devel-ja

投稿者 xml-rpc : 2007年10月 6日 08:52
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/64918
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。