2010年1月 8日

[mysql 15138] Re: [mysql 15137] Re: [mysql 15136] Re: utf8文字化け(森鴎外)


> しかしながら、下記のサイトにあるような問題がありますので、MySQLの将来を
> 考えた上で、これらの諸問題が解決されることを願っています。

UTFの、世界中の文字の統一的符号化標準を造ろう、と
いう思想は場当たり的です。

そもそも、記号は世代を経るごとに進化するものだから、

です。

人間が記号を発想して定着する過程の諸原理を明らかに
すること無しに、如何なるIT研究開発を進めても無駄かつ
無意味かつ税金及び公的資金の無駄でしょう。

理論的仮説の議論をないがしろにしたまま、IT施工工事を
推し進めるようなものです。

思わず話題に反応して(しょーもない)メールを送ってしま
いましたが、要するにつまり、

『天才は良いの、凡才は駄目なの』

という文明進化の原理原則をを標語にして、無駄な啓蒙活動
はとっとと停止して、まじめにコツコツと正しく働きましょう。

金持ち凡才主導主義を排しましょう。
天才専制主義をもっと徹底しましょう。


>
>
> @檸檬の家 MySQLの改定常用漢字表対応が危うい件
> http://blog.motoyuki.net/2009/12/mysql_4a9c.html
>
>
> -----------------------------------------------------------
> 荒浪 一城(Kazuki Aranami)
>
> Twitter: http://twitter.com/kimtea
> Email: kazuki.aranami@xxxxx
> http://d.hatena.ne.jp/kazuki-aranami/
> -----------------------------------------------------------
>
>
>
> 2010年1月8日12:47 SAKAI Kei <sak2@xxxxx>:
>> 坂井です
>>
>> 戸田さん、まずは確認できたようでなによりです。
>> 若干まとめていただいた内容で誤解があるようなので補足させて
>> いただきます。
>>
>>> ・MySQL5のutf8は3バイトまでしか対応していません。
>>> ・UTF-8の4バイト対応は、MySQL6.0.4以降になります。
>>
>> MySQL 5.0, 5.1, 5.5-m2 は、いわゆる「4バイトUTF-8」には
>> 対応していません。
>> MySQLのリリースモデルが変更になったためおそらく、
>> MySQL 5.6 相当のマイルストンリリースで乗るのではないかと
>> 聞いたことがあるような気がします[要出典]。
>> MySQL 6.0 はすでに開発が中止されています。
>>
>> 補足ついでにあと2つほど。
>> ・4バイトUTF-8文字の一覧:
>> http://www.mysql.gr.jp/frame/modules/bwiki/index.php?cmd=read&page=utf8_4
>>
>> ・今回はファイルに落として確認しましたが手早く文字コード(16進)
>> で確認したいなら、HEX() 関数が便利です。
>>
>> 実行例)
>> mysql> select hex(name) from hito;
>> +--------------------+
>> | hex(name) |
>> +--------------------+
>> | |
>> | E6A3AEE9B797E5A496 |
>> +--------------------+
>> 2 rows in set (0.02 sec)
>>
>> これを見ても、森(E6A4AE) オウ(E9B797) 外(E5A496) 各
>> 3バイトなのがわかりますね。
>> (森外、と森オウ外 を登録して比較したら尚わかりやすいかもしれません)
>>
>>
>> thank you
>> On Fri, 8 Jan 2010 12:26:42 +0900
>> 戸田峻 <todappi@xxxxx> wrote:
>>> 坂井さん
>>>
>>> > 戸田さん。鴎外の旧字ってヘンの中身が口三つのやつですよね。
>>>
>>> まさにその漢字です
>>>
>>>
>>> > 最初にINSERT文を作成して確認したのが秀丸エディタなので、
>>> > 結果の確認もまずは同じ環境で行ってみたらどうでしょうか。
>>> > (表示ツール側の対応状況により表示されていないだけの気がします)
>>> >
>>> > 方法例:
>>> > mysql サーバに接続(utf8で)
>>> > mysql> プロンプトで tee c:\out.txt と入力(ファイル名はご自由に)
>>> > mysql> プロンプトで SELECT * FROM <そのテーブル> を実行
>>> > 秀丸エディタで c:\out.txt を確認(utf8で)
>>>
>>> 上記方法例で文字化けがしないことが確認できました。
>>> ありがとうございます。
>>>
>>> すばやい返答ありがとうございました。
>>>
>>> また多方面からいろいろな情報をいただき皆様ありがとうございます。
>>> ・MySQL5のutf8は3バイトまでしか対応していません。
>>> ・UTF-8の4バイト対応は、MySQL6.0.4以降になります。
>>>
>>>
>>> 以上、ありがとうございました。
>>>
>>> 2010年1月8日12:15 SAKAI Kei <sak2@xxxxx>:
>>> > 坂井です
>>> >
>>> > 戸田さん。鴎外の旧字ってヘンの中身が口三つのやつですよね。
>>> >
>>> > 最初にINSERT文を作成して確認したのが秀丸エディタなので、
>>> > 結果の確認もまずは同じ環境で行ってみたらどうでしょうか。
>>> > (表示ツール側の対応状況により表示されていないだけの気がします)
>>> >
>>> > 方法例:
>>> > mysql サーバに接続(utf8で)
>>> > mysql> プロンプトで tee c:\out.txt と入力(ファイル名はご自由に)
>>> > mysql> プロンプトで SELECT * FROM <そのテーブル> を実行
>>> > 秀丸エディタで c:\out.txt を確認(utf8で)
>>> >
>>> > おそらく正しく表示されると思います。
>>> >
>>> >
>>> > Thank you
>>> > On Fri, 8 Jan 2010 11:44:30 +0900
>>> > 戸田峻 <todappi@xxxxx> wrote:
>>> >> 戸田と申します。
>>> >> 長々と記載して申し訳ありません。
>>> >>
>>> >> 現在一部のutf8の漢字が文字化けが発生してしまい解決が出来ません。
>>> >>
>>> >> 下記私の設定情報、現在の状態です。
>>> >>
>>> >> ・環境
>>> >> Microsoft Windouws XP
>>> >> MySQL5.1
>>> >>
>>> >> ・DBの文字コードの設定情報(下記コマンド実行)
>>> >> show variables like 'character_set%'
>>> >>
>>> >> 結果
>>> >> character_set_client | utf8
>>> >> character_set_connection | utf8
>>> >> character_set_database | utf8
>>> >> character_set_filesystem | binary
>>> >> character_set_results | utf8
>>> >> character_set_server | utf8
>>> >> character_set_system | utf8
>>> >> character_sets_dir | C:\Program Files\MySQL\MySQL Server
>>> >> 5.1\share\charsets\
>>> >>
>>> >>
>>> >> ・入力したデータ(入力した方法)
>>> >> utf8での漢字データの入力
>>> >> -varchar(10)属性に下記データ入力
>>> >> aaa
>>> >> 常用漢字
>>> >> 森鴎外(※鴎:おう 実際は旧漢字を入力してます)
>>> >>
>>> >>
>>> >> 方法
>>> >> -秀丸エディタにて文字コードをutf8に設定
>>> >> -簡単なinsert文を記述し(データに漢字を入力)、.sql拡張子で保存
>>> >> -コマンドプロントにてsourceコマンドを使用し上記作成ファイルを実行
>>> >> -結果は「Query OK, 0 rows affected (0.00 sec)」
>>> >>
>>> >> ・入力されたデータの確認(※この時点で文字化け発生)
>>> >> CSEで確認(CSE:sql開発ツール)
>>> >>
>>> >> -ODBCコネクタでutf8→sjisに変換(自動的にしてくれる)
>>> >> -CSEにてselectクリエ実行
>>> >> -出力されたデータ
>>> >> aaa
>>> >> 常用漢字
>>> >> 森?外(※旧漢字の鴎が?に文字化け)
>>> >>
>>> >> コマンドプロントで確認
>>> >> レジストリを弄り、utf8でMSゴシックを使用できるよう設定
>>> >> -レジストリエディタでCodePageとTrueTypeFontで65001を追加
>>> >> -コマンドプロントを開き、chcp 65001コマンドを実行(コマンドプロントをsjis→utf8に変換)
>>> >> -以下データベースに接続、select文実行
>>> >> -下記結果内容が出力される
>>> >> 入力されているはずのデータ
>>> >> aaa
>>> >> 常用漢字
>>> >> 森鴎外(※鴎:おう 実際は旧漢字を入力してます)
>>> >>
>>> >> 結果
>>> >> aaa
>>> >> 常用漢字
>>> >> 森?外(※旧漢字の鴎が?に文字化け)
>>> >>
>>> >>
>>> >> Windouws上でどうutf8の漢字データを入力して、どう確認していいのかが不明です。
>>> >> 何かご指摘があればお願いします。
>>> >>
>>> >> 以上、よろしくお願いします。
>>> >
>>> >
>>> >
>>> >
>>
>>
>>
>>
>

投稿者 xml-rpc : 2010年1月 8日 13:19
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/92150
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。