2011年7月25日

[Namazu-devel-ja 1861] Re:stable-2-0 に 2.0.21 を反映

寺西です。

(2011/07/19 22:53), Yukio USUDA wrote:
> On 2011/07/19, at 21:27, Tasamasa Teranishi wrote:
>> HEAD はたぶんこの修正ではダメなので、どうするか考えないといけない
>> かもしれません。
>
> 出力文字コードが EUC-JP のときに EUC-JP として出力する前に掃除を

> するというのでもよさそうですが

今回のものだけで考えれば、(ちょっと気になるところもありますが、
たぶん)それでもよさそうです。

一歩先まで考えると、出力文字コードの種類ごとにチェックすべき
なんでしょうね。(出力時チェック)

今回修正は内部コードへの変換時チェックなので、変換時チェックと
出力時チェックの2段構えがより安全なんでしょうね。
(他のブラウザのバグ対策まで広げて考えるのなら...。)

>> 同じ考え方で実装するなら、内部コードに変換した時に、UTF-8 として
>> 問題ないかどうかをチェックするということになるでしょうか。

ただ、HEAD の 変換時チェック については、結構厄介なんですよね。
UTF-8 として正しいかというチェックは何気に難しいのが悩ましいところ
です。チェックの前に正規化をしないといけないのですが、この正規化が
これまた厄介なので。
--
=====================================================================
寺西 忠勝(TADAMASA TERANISHI) yw3t-trns@xxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E
_______________________________________________
Namazu-devel-ja mailing list
Namazu-devel-ja@xxxxx
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-devel-ja


投稿者 xml-rpc : 2011年7月25日 03:43
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/105204
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。