2006年8月25日

[Namazu-devel-ja 1171] Re: nmz/codeconv.c(get_external_charset) について

臼田です

On 2006/08/25, at 3:53, Tadamasa Teranishi wrote:

> - "french", "deutsch", "german", "spanish" は ISO-8859-1,
> "polish" は ISO-8859-2 として扱いますが、"german",
> "spanish",
> "polish" はメッセージカタログの方は対応していないので、暫定

> 状態
> です。
>
ISO-8859-1 のままだった po/fr.po, po/es.po を utf-8
に変換しました。

> 従来は US-ASCII 前提の英語を他の国の言語と同様に扱いまし
> た。
> これは、英語だけが ISO-8859-* を扱えないのも不自然なため
> です。
> とは言え、全ての環境で利用できる US-ASCII がないのも不便
> です。
> "en" の扱いを変えて、US-ASCII の "C" と分ける等考
> えないと
> いけないのかもしれません。
> メッセージカタログと合わせて今後検討していきたいと思います。

多くの文字が表示できる英語環境という意味では
en_US.utf-8 や en_GB.utf-8 がありますが、そういう意味では
ない
のでしょうか?

本来メッセージ表示の言語、文字コードと
インデックス対象の言語、文字コードは独立しているべきだと思います。
インデックスについては既に --index-lang オプションがあるので
必要に応じて同様のオプションを追加していくことになるのでは
と思います。


>
> なお、これらの修正は HEAD に対して行いましたが、
> development-2-1 にも
> 評価用に廉価版の get_external_charset() を導入しました。

STABLE の namazu でも iconv を 使うことにした
のであれば廉価版といわず
utf-8 ターミナルでの表示にも対応してしまってもよいのではないで
しょうか。

臼田幸生

_______________________________________________
Namazu-devel-ja mailing list
Namazu-devel-ja@xxxxx
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-devel-ja

投稿者 xml-rpc : 2006年8月25日 21:20
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/44548
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。