2007年5月10日

[pgsql-jp: 38404] Re:PostgreSQLとJIS X 0213

石井です.

> 海老原です。
>
> 石井さん、ご回答どうもありがとうございます。

どういたしまして.

> > > 8.1.7以降、8.2.2以降であれば、サーバエンコーディングをUTF-8にし、
> > > クライアントエンコーディングもUTF-8にすれば、JIS X 0213文字を
> > > 出し入れできる、という僕の理解は正しいでしょうか?
> >
> > フロントエンドとバックエンドのエンコーディングがどちらもUTF-8なら,基
> > 本的に入れたものはそのまま出てくるだけなので,JIS X 0213であろうとなん
> > であろうと「使える」ということになります.
>
> そうでした。確かに「出し入れ」に問題があるはずはないのでした。
> 演算子や関数が正しく機能するか、という観点なども必要ですね。

それは当然動作するという前提です.もしうまく動かなければバグなので,是
非レポートを.

> マニュアルの「サポートされる文字セット」(8.2だと第21章)に、
> サポートされるキャラクタセットの一覧があります。
> 8.1.0以降では、各キャラクタセットで取り扱えるバイト数の説明が
> 付加されるようになっていますが、実はそれによれば、以前から
> UTF8の最大長は4バイトということになっているのですよね。
>
> ただし8.1.7、8.2.2で以下のBugがFixされています。
>
> (原文)
> Tighten security of multi-byte character processing for UTF8
> sequences over three bytes long
>
> (日本語訳)
> 3バイト長を越えるUTF8シーケンスに関する、複数バイト文字処理の
> セキュリティを強化しました。

実際にはいろいろありましたが,要はシステムの中で,使えるバイト数が実は
ばらばらだった,というのがオチです.で,4バイトで統一されたと.

> 以上を総合すると、やはり問題なくJIS X 0213を扱えるのは、
> 「8.1.7以降または8.2.2以降で、サーバもクライアントもUTF8の場合」
> ということで理解しました。
--
Tatsuo Ishii
SRA OSS, Inc. Japan

投稿者 xml-rpc : 2007年5月10日 14:52
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/58380
トラックバック
JIS X 0213:2004(JIS2004) と Java と PHP と RDBMS
概要 ずいぶん前に, EC-CUBE の ML へ投稿した話題ですが, どうも過去ロ...
ウェブログ: Think Different. 時刻: 2008年4月11日 02:03
コメント
コメントする




画像の中に見える文字を入力してください。