2008年7月25日

[ruby-list:45266] Re: character encodings differ: US-ASCII and ISO-2022-JP


On Fri, 25 Jul 2008 04:11:52 +0900
In article <4888D558.7010900@xxxxx>
[[ruby-list:45258] Re: character encodings differ: US-ASCII and ISO-2022-JP]
"NARUSE, Yui" <naruse@xxxxx> wrote:

> > "ab" + NKF.nkf("-jE --mime", "あいうえお").force_encoding("US-ASCII")
> > # => "ab=?ISO-2022-JP?B?GyRCJCIkJCQmJCgkKhsoQg==?="

>
> ちなみに、
> "ab=?ISO-2022-JP?B?GyRCJCIkJCQmJCgkKhsoQg==?=" は正しくありません。
> "ab =?ISO-2022-JP?B?GyRCJCIkJCQmJCgkKhsoQg==?=" が正解ですね。

不正解です。それだとデコード後に "ab あいうえお" になってしまいます。
まとめてエンコードして =?ISO-2022-JP?B?YWIbJEIkIiQkJCYkKCQqGyhC?= にする
のが正解。

--mime の時は、エンコード後に結合せずに NKF に任せましょう。

irb(main):003:0> NKF.nkf('-Wj --mime', "abあいうえお")
=> "=?ISO-2022-JP?B?YWIbJEIkIiQkJCYkKCQqGyhC?="
irb(main):004:0> NKF.nkf('-Wj --mime', "ab あいうえお")
=> "ab =?ISO-2022-JP?B?GyRCJCIkJCQmJCgkKhsoQg==?="


--
Tietew <tietew@xxxxx>
Blog: http://www.tietew.jp/
PGP: 26CB 71BB B595 09C4 0153 81C4 773C 963A D51B 8CAA

投稿者 xml-rpc : 2008年7月25日 15:49
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/75664
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。