2007年10月 6日

[Namazu-devel-ja 1642] Re: mknmz --no-heading-summary オプションの仕様について

臼田です

Tadamasa Teranishi さんは書きました:
> 寺西です。
>
> Yukio USUDA wrote:
>> 結果的に HEAD で追加した部分が元の仕様と同じ動作を
>> 満たしていなかったという結果でしたが

>
> それだけでなくて、HEAD, development-2-1 の動きは少々妙な気はします。
> # まだちゃんと調べてはいませんが。

filter/html.pl に関しては正規表現を使用している STABLE とは
抽出の方法や思想が根本的に違うため同じにはなりません。
互換性の話を問われても対応できない部分があるため
これは2.0系にはいれません。

> なお、HTML::Parser 版は全般的にまだ十分テストされていませんが、
> パース処理以外の振る舞いは、stable-2-0 と一致しないと何かと
> トラブルの元ですので、あわせるようにしましょう。
互換性以外に stable-2-0と合わせる理由がないものは無理に
あわせない方がよいと考えています。

> その上で、仕様変更が望ましいものは、変更箇所を明確化して変更する
> のが良いでしょう。
これはそのとおりです。
> となり、heading が短い場合は、いずれのケースでも要約に現れます。
> (また、heading が短い場合というのはしばしば起こります。)
>
> これは、-x が事実上、無力化されます。(重みが変わる程度)
> こちらを立てれば、あちらが立たずといった、それはそれでいいのかと
> いう話です。
> # たぶん、検索の方が重要という意見が多いとは思うけど。
要約は summary 検索以外では検索に引っかからないため
heading は要約に入れるだけでなく本文にも含めるべきかと
考えます。

-x オプションの思想はおそらく標題の単語は本文に必ず
含まれているので本文に追加しなくても良いという理想論
かと思われます。
実際は html のタグは規格どおりには使われていないため
今回のような例では意図せぬ結果となります。

だいぶ前のことなので思い出せませんが、HEAD と stable
の違いについてはこれらを考えて
HTML::Parser を使うルーチンを加えたときに意図して
stable と違う振る舞いにしたのかもしれません。

Namazu 管理者と文書作成者が一致しているわけではないので
文書の読み込みに対しては可能な範囲で寛容な振る舞いをする
ようにしておくのがよいと考えています。

> 根本的には -x オプションの仕様であるとか、要約作成部分の処理の問題
> で、大幅に変えないといけない話になるので、2.0では手を出さないのが
> 良いかなと思っています。
2.0 まではそういう仕様だったということにして stable はもう修正せずに
放置しましょう。

> 2.0 に関してはバグフィックス以外の変更は極力行わない方向で進めて
> います。また、バグフィックスであってもセキュリティ上の問題以外は
> 大幅な修正が必要なものも避けたいと思います。(2.0は開発終了)
> # といいながら、たまに手を加えてしまってますけど...。
>
> 一方で 2.2 での議論は活発にしましょう。
2.2についてはリリースまでの
追加機能リストや必須修正項目をたてて
形にしていく必要があるかと思います。

臼田幸生
_______________________________________________
Namazu-devel-ja mailing list
Namazu-devel-ja@xxxxx
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-devel-ja

投稿者 xml-rpc : 2007年10月 6日 09:59
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/64919
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。