2006年8月25日

[Namazu-devel-ja 1174] Re: nmz/codeconv.c(get_external_charset) について

臼田です

On 2006/08/25, at 22:18, Tadamasa Teranishi wrote:

>
> ここではテンプレートに絞って話をします。
> テンプレートに関しては話が複雑なので整理しないといけないと感じて
> います。

>
>

> 英語でも US-ASCII 以外を使うには、
> A. 基本テンプレートの NMZ.xxx を US-ASCII から
> UTF-8 に変える
> B. 基本テンプレートは US-ASCII のまま NMZ.xxx.en
> を用意する
> のいずれかが考えられます。
>
> それならば、簡単に A でよさそうな気もするのですが、どの
> 端末でも
> 全ての文字が表示できるであろう US-ASCII で基本テンプレー
> トを作る
> B の方が、なんとなく安心できます。
> (UTF-8 -> US-ASCII に変換して表示はできますが、US-ASCII
> 以外の文字
> が欠落して表示するよりは、基本テンプレートは US-ASCII で
> 完結して
> いるのが何となく良いかなという感じがするからです。)
>

namazu と namazu.cgi が共通のテンプレートを使っているため
テンプレートの話が端末の話にも関係してしまうので
どうもよくないですね。

冗長ですが B が統一感と安心感がありますね。
他のツール類はどういう扱いをしているのでしょうかね?


>> 本来メッセージ表示の言語、文字コードと
>> インデックス対象の言語、文字コードは独立しているべきだと思い
>> ます。
>
> LC_MESSAGES と LC_CTYPE で独立していますが、そうではなく
> て?

確かにそうですね。
LC_CTYPE に日本語以外の言語を設定して意味があるように拡張を
していかないといけませんね

>
>> インデックスについては既に --index-lang オプションがあ
>> るので
>> 必要に応じて同様のオプションを追加していくことになるのでは
>> と思います。
>
> --index-lang オプション導入時にも反対したのですが、このオプ
> ションは
> あまりよくありません。少なくとも現在の実装はまずいです。
> できれば、このオプションは廃止したいと思います。

実装の善し悪しは別として
ログに日本語が入るといやだったので
私自身はこの実行時オプションのおかげで助かった記憶もあります。
環境変数に依存して処理を分岐する方法しかないと
シェルの種類によって設定法が違ったりして初心者にはつまづきのもと
です。
残しておいてほしいです。

>
>>> なお、これらの修正は HEAD に対して行いましたが、
>>> development-2-1 にも
>>> 評価用に廉価版の get_external_charset() を導入しました。
>>
>> STABLE の namazu でも iconv を 使うことにした
>> のであれば廉価版といわず
>
> STABLE とは stable-2-0 でしょうか? それとも
> 2.2 でしょうか?
> stable-2-0 では互換性のこともあるので iconv は導入しませ
> んが、
> 2.2 にはもちろん導入します。
>
TEST_UTF8 をデフォルトにしたという記述があったと思っていたのでし
たが
HEAD だけでしたね

臼田幸生

_______________________________________________
Namazu-devel-ja mailing list
Namazu-devel-ja@xxxxx
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-devel-ja

投稿者 xml-rpc : 2006年8月25日 23:52
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/44561
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。