2007年10月 6日

[Namazu-devel-ja 1643] Re: mknmz --no-heading-summary オプションの仕様について

寺西です。

Yukio USUDA wrote:
>
> Tadamasa Teranishi さんは書きました:
> >
> > それだけでなくて、HEAD, development-2-1 の動きは少々妙な気はします。
> > # まだちゃんと調べてはいませんが。

>
> filter/html.pl に関しては正規表現を使用している STABLE とは
> 抽出の方法や思想が根本的に違うため同じにはなりません。

というより、ここは -x か $INVALID_LENG の処理に問題がありそうだと
いう話です。
それと互換性の話はまた別でバグなんではないかという認識です。
# まだちゃんと調べてないので、誤解かもしれませんけど。

で、互換性の話は

> 互換性の話を問われても対応できない部分があるため
> これは2.0系にはいれません。

互換性はとるべきだろうと思います。ここで言う互換性とは、抽出される
テキスト1文字も違いを許さないということではありません。
パース処理の都合で異なる部分(stable-2-0 で正しく処理できていない部分
を合わせろということではありません)
は仕方ないのですが、

> > なお、HTML::Parser 版は全般的にまだ十分テストされていませんが、
> > パース処理以外の振る舞いは、stable-2-0 と一致しないと何かと
> > トラブルの元ですので、あわせるようにしましょう。
> 互換性以外に stable-2-0と合わせる理由がないものは無理に
> あわせない方がよいと考えています。

HTML::Parser を使うか否かで、振る舞いが違うのは問題だからです。
これはトラブルの元です。(実際、現状バグなのか、意図して振る舞いが
違うのか、何だかよく分かっていない。調査に時間がかかりそうです。)

現状、development-2-1, HEAD は HTML::Parser を使わない場合は
従来の処理が動きます。これは将来 HEAD の方は削除しても構わない
のですが、少なくとも現状は両者が動くので、互換性は必要でしょう。
(2.2 は HTML::Parser に一本化でしょうね。やっぱり)

また、将来はともかく、HTML::Parser 版は全般的にまだ十分テストされて
いませんので、パース処理以外の振る舞いは合わせておかないと、
どこにバグがあるのか調べるのが大変です。

> > その上で、仕様変更が望ましいものは、変更箇所を明確化して変更する
> > のが良いでしょう。
> これはそのとおりです。

で、現状の stable-2-0 の振る舞いでまずいところは、当然改善して
いきたいわけですので、stable-2-0 と意図して振舞いを変えるのは
将来的に組み込むにしても、現状は避けておきたいところです。

あるいは何かスイッチをつけて明確にその振る舞いに切り替えるかです。

これは HTML::Parser 版 html.pl だけではなく、外部ツールの違いに
より、文書ファイルの処理が異なるところにもあてはまる話です。

> だいぶ前のことなので思い出せませんが、HEAD と stable
> の違いについてはこれらを考えて
> HTML::Parser を使うルーチンを加えたときに意図して
> stable と違う振る舞いにしたのかもしれません。

というのは、避けて欲しいのです。でないと、意図的なのか、バグな
のかが分かりません。
これは互換性をとるように作ることはできるはずですので、互換性を
とった上で、何かスイッチ(コマンドラインのスイッチまでは必要なく、
デバッグ用にグローバル変数を使ったフラグ程度でも良い)で切り替え
られるのが、現状では良いでしょう。

もちろん将来的にはそのようなスイッチは廃止するにしてもです。

> > 根本的には -x オプションの仕様であるとか、要約作成部分の処理の問題
> > で、大幅に変えないといけない話になるので、2.0では手を出さないのが
> > 良いかなと思っています。
> 2.0 まではそういう仕様だったということにして stable はもう修正せずに
> 放置しましょう。

はい。namazu-devel-ja#1638 は、そのつもりで書いています。
もちろん 2.2 に関しての記述ではありません。

> > 一方で 2.2 での議論は活発にしましょう。
> 2.2についてはリリースまでの
> 追加機能リストや必須修正項目をたてて
> 形にしていく必要があるかと思います。

まぁそうなんですけど、全然進められないのですよね。2.0 のバグに
追われていて。それもあって、できるだけ 2.0 の修正は避けたいわけです。

# 2.0.18 のリリースすらできない状況ですし...。
--
=====================================================================
寺西 忠勝(TADAMASA TERANISHI) yw3t-trns@xxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E

_______________________________________________
Namazu-devel-ja mailing list
Namazu-devel-ja@xxxxx
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-devel-ja

投稿者 xml-rpc : 2007年10月 6日 10:49
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/64920
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。