2011年7月 6日

[Namazu-devel-ja 1828] HEAD の修正

臼田です。


HEAD を久しぶりに checout してみたところ
だいぶ放置していたためか
最近の環境で make check をしたらエラーが出たりいろいろ不具合が
見えるようになっていました。

わかった範囲で以下の修正を行い commit しました。

filter/html.pl:
Parsing of undecoded UTF-8 will give garbage when decoding entities at
というワーニングが頻発していたので調べたところ
HTML::Parser の仕様が何らか変化しているようでしたので
Workaround らしきものを追加しました。

filter/taro7_10.pl:
NKF2.07 環境で UTF-16 の変換がうまくいかなかったので
BOM を追加するように戻しました。

scripts/nmzcat.in:
文字コード変換が NKF モジュール利用を前提にしていたので
Encode も選べるように修正

pl/util.pl, nmz/codeconv.pl:
locale が UTF-8 となっているものに対応していなかったので修正

tests/{ja-namazu-cgi-1, ja-namazu-cgi-2}:
テスト実行時の locale 指定を ja だけでなく詳細な表記に修正


その他、以下の問題が見つかり課題が残りました。

1. OSX 環境で tests/ja-namazu-4 が fail になる。
 ファイル名に様々な文字コードを使用した場合のテストなので
 OS もしくはファイルシステムが許可していない場合は無理がある。
 OSによってはテストをスキップする必要がある。

2. filter/man.pl が対応できていない nroff が出回っている。
 tests/ja-namazu-cgi-2 が fail になったため発見しましたが
 ubuntu Linux や Mac OSX に入っている nroff は オプションが異なるのか
tests/data/ja/man.1 の表示ができません。
 そもそも EUC-JP で書かれた man ページが処理できない可能性があります。

臼田幸生

_______________________________________________
Namazu-devel-ja mailing list
Namazu-devel-ja@xxxxx
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-devel-ja


投稿者 xml-rpc : 2011年7月 6日 20:43
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/104813
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。