2011年7月23日

[Namazu-devel-ja 1857] Re:HEAD の修正

臼田です

On 2011/07/07, at 4:09, Yukio USUDA wrote:
>
> で、 NKF 捨ててコードの整理をしたいと思っていたのですが、
> make check の範囲内だけでも Encode::Guess を使った文字
> コード判定が失敗するケースが見られるようです。
> とりあえず細かい不具合を直してから Encode::Guess の

> 使い方を研究することにしたいと思っています。

ISO-2022-jp の文書を
Encode::Guess が "7bit-jis or utf-8-strict" として
曖昧判定するようになっていたのが原因でした。

pl/codeconv.pl の decide_encode に 7bit-jis を判定する処理を追加し、
判定が可能になるようにしました。

また、問題のあるフィルタを特定しやすいように
tests/ja-documentpl-1 というテストを追加しました。
このテストでは NKF.pm と Encode の両方を用いて
tests/idx1/NMZ.r にリストされている全ファイルのテキスト抽出
を確認しています。

HEAD にこれらの修正を commit しました。

Encode の利用で問題はないようなので
HEAD では Perl5.8 以上を前提として
NKF.pm と nkf コマンドを使用しているところを
削っていこうと思います。

臼田幸生
_______________________________________________
Namazu-devel-ja mailing list
Namazu-devel-ja@xxxxx
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-devel-ja

投稿者 xml-rpc : 2011年7月23日 23:40
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/105199
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。