2006年4月 5日

[mysql 12915] Re: 全角カタカナソート処理仕様

市川と申します。

> これらをまとめた仕様説明のサイトがあれば教えていただけますか?

それは知らないんですが、
Collation(照合順序)の定義により違う、というのが解ではないかと思います。

ごめんなさい、


> mysql5.0.18は違うと言う情報があります。

の話はよくわからないのですが、私の知っている限り(4.1.x)だと、

-UTF8はutf8_general_ciとバイナリ照合順序の2種類をサポートしている。
-utf8_general_ciはマニュアル上はUCA4.0.0準拠.
http://www.unicode.org/Public/UCA/4.0.0/allkeys-4.0.0.txt.
バイナリ照合順序はただ単純に文字コード順
-自分でCollationを書こうとするのはひじょーにめんどくさかったので断念した。
(プログラムの構造自体がlatin-1はともかくutf8なりucs2の照合順序を素直に定義しなおせるようにはできてなかったような記憶あります...)

なのです。

...で、それはともかく、
> ーァアィイゥウェエォオカガキギクグケゲコゴサザシジスズセゼソゾタダチヂッツヅ
> テデトドナニヌネノハバパヒビピフブプヘベペホボポマミムメモャヤュユョヨラリル
> レロワン
> (アイウエオ.......ァィゥェォなどではないんですね、、、)

> ァアィイゥウェエォオカガキギクグケゲコゴサザシジスズセゼソゾタダチヂッツヅテ
> デトドナニヌネノハバパヒビピフブプヘベペホボポマミムメモャヤュユョヨラリルレ
> ロワンー
> (長音が最後)

この2者の並び方の問題(長音の位置)はおそらくSJISとUTF8でコードの順番が違うというのが原因ではないかと思います。
照合順序(これは結局tableの文字コードに依存します)がSJISなのかUTF8なのかで違う、という話ではないかな....

市川@いや、照合順序は重要なんでどっかで定義できるような形にできるといいなあ、と思いながら...

投稿者 xml-rpc : 2006年4月 5日 13:39
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/34437
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。