2006年8月26日

[Namazu-devel-ja 1177] Re: nmz/codeconv.c(get_external_charset) について

寺西です。

Yukio USUDA wrote:
>
> utf8index-branch を作った際に nmz_codeconv_external を
> 拡張しようとして japanese の処理と同じものをとりあえず
> "french", "deutsch", "german", "spanish", "polish" についても

特別サポートしないといけないという理由でなければ、まだリリース
されていませんから、"french", "deutsch", "german", "spanish" を
削除するのも良いかもしれません。

これらは "japanese" 同様、古い形式でしょう。

"japanese" も気づきませんでしたが、NMZ.xxx.ja は読まず、NMZ.xxx
を読むようなので、実際使うには NMZ.xxx.japanese を用意しないと
いけません。
そのため、実質 "japanese" は使われていないということのようです。
互換性のために必要かと思いましたが、必要なさそうです。

> > xx_XX.xxxx の形式(例えば ja_JP.eucJP)以外のサポー
> > トはしたくない
> > ところなのですがね。
>
> locale に "japanese" と設定している OS というのは古
> めのものなのでしょうが、
> サポートしていく必要があるのですかね。

前述のこともあるので、"japanese" を含めて削除しても良いように思います。

ところで、

ロケール名:
language(_territory)(.encoding)(@modifier) の形式

- language は、ISO-639-1に定義された2文字のコードが普通
- 国/地域コードはISO-3166-1に定義された2文字のコードが普通

ですので、get_external_charset() じゃなくて、get_external_encoding()
の方が良かったかな?

あと、modifier の処理にも対応しておいた方がよさそうです。
es_ES は ISO-8859-1 ですが、es_ES@xxxxx は ISO-8859-15 だったり
するので、現在の '@'以降を削除しただけの対応ではちょっとまずいかも
しれません。
(@saaho, @cyrillic とかは対応しませんが、@euro ぐらいは対応しておいて
もバチはあたらないでしょうから。)
--
=====================================================================
寺西 忠勝(TADAMASA TERANISHI) yw3t-trns@xxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E

_______________________________________________
Namazu-devel-ja mailing list
Namazu-devel-ja@xxxxx
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-devel-ja

投稿者 xml-rpc : 2006年8月26日 01:57
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/44568
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。