2011年7月 7日

[Namazu-devel-ja 1831] Re:HEAD の修正

臼田です

On 2011/07/07, at 2:18, Tasamasa Teranishi wrote:
>
> 申し訳ない。
> stable や development の差分を反映することはありますが、ロクに
> チェックしてないものでまずい修正を行っているかもしれません。

しばらくさぼっていてすみません。
最近の端末環境も Web の文字コードも UTF-8 が前提なもの
ばかりになっているので
とりあえず Nightly でもα版でもいいので
評価版をリリースするところまで持っていきたいです。

>> filter/taro7_10.pl:
>> NKF2.07 環境で UTF-16 の変換がうまくいかなかったので
>> BOM を追加するように戻しました。
>
> もう NKF は捨ててもいいかもしれません。
これ、 Ubuntu のapt-get で入ってきたのが 2.07-1 とかいう
バージョンだったので、こんなところで make check が
ひっかかるのもいやなのでとりあえず、これに対応するため
もどしました。

で、 NKF 捨ててコードの整理をしたいと思っていたのですが、
make check の範囲内だけでも Encode::Guess を使った文字
コード判定が失敗するケースが見られるようです。
とりあえず細かい不具合を直してから Encode::Guess の
使い方を研究することにしたいと思っています。

>
>> その他、以下の問題が見つかり課題が残りました。
>>
>> 1. OSX 環境で tests/ja-namazu-4 が fail になる。
>>  ファイル名に様々な文字コードを使用した場合のテストなので
>>  OS もしくはファイルシステムが許可していない場合は無理がある。
>>  OSによってはテストをスキップする必要がある。
>
> もはや時代遅れのチェックということかもしれませんね。
> 廃止も含めて検討ですね。

これは時代遅れというよりは、仕様にするにはちょっと無理かも
というチャレンジ部分のものです。
ファイルシステムの文字コードがなんであってもファイル名検索を
できるようにしたいというものをテストする為に
ファイル名にEUC,Shift_JIS,UTF-8,CAPSの4種の文字コードを使って
書き込んでインデックス作成をしているので、ファイル作成時点で
うまくいかない環境は Namazu の機能チェックの必要もないの
でテストをスキップするという前処理を入れたいと思います。

>
>> 2. filter/man.pl が対応できていない nroff が出回っている。
>>  tests/ja-namazu-cgi-2 が fail になったため発見しましたが
>>  ubuntu Linux や Mac OSX に入っている nroff は オプションが異なるのか
>> tests/data/ja/man.1 の表示ができません。
>>  そもそも EUC-JP で書かれた man ページが処理できない可能性があります。
>
> こちらも時代の流れでということでしょう。
> filter/man.pl の仕様も検討し直す必要がありますね。

これは時代の流れを感じますね。
man ぐらいは自力でパースした方がよいですね。
と、検索をしてみたら6年前に同じ議論をしていて
roff を使わずなんとかできるフィルタの試作もしていました。
http://www.namazu.org/pipermail/namazu-devel-ja/2004-October/000296.html
これ使えるのかな。

臼田幸生
_______________________________________________
Namazu-devel-ja mailing list
Namazu-devel-ja@xxxxx
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-devel-ja

投稿者 xml-rpc : 2011年7月 7日 04:09
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/104817
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。