2007年12月28日

[ruby-list:44420] 1.9.0のERBでマルチバイトが扱えません

こんばんは。まちゅといいます。

Ruby1.9.0のリリース、おめでとうございます。
さて、1.9.0上でtDiaryを動かそうとしていて気がついたのですが、
ERBに渡したテンプレートのencodingが欠落してしまうようです。
そのため、ERBでマルチバイトを含む文字が扱えません。

状況を整理しましたので、こちらで報告します。


* 環境
ruby 1.9.0 (2007-12-25 revision 14709) [i386-freebsd6.1]

* 再現方法
以下のサンプルで試しました。
----
require 'erb'

data = "データ"
rhtml = "テンプレート + <%= data %>"
erb = ERB.new(rhtml)

puts "data: #{data.encoding}"
puts "rhtml: #{rhtml.encoding}"
puts "erb.src: #{erb.src.encoding}"
puts erb.result(binding)
----

サンプルを実行すると、rhtmlのencodingがEUC-JPから
ASCII-8BITへと変わってしまい、文字列の連結に失敗します。

----
$ ruby --encoding=EUC-JP test.rb
data: EUC-JP
rhtml: EUC-JP
erb.src: ASCII-8BIT ← ここがEUC-JPからASCII-8BITに変わっている
(erb):1:in `concat': character encodings differ (ArgumentError)
----


* 対処方法
正しいかどうかの自信はないのですが、
ERB#initialize でテンプレートと同じencodingを指定することで
先ほどのサンプルは期待通り動作するようになりました。

----
--- erb.rb.org Fri Dec 28 23:05:02 2007
+++ erb.rb Fri Dec 28 23:05:18 2007
@@ -689,6 +689,7 @@
compiler = ERB::Compiler.new(trim_mode)
set_eoutvar(compiler, eoutvar)
@src = compiler.compile(str)
+ @src.force_encoding(str.encoding)
@filename = nil
end
----

--
MATSUOKA Kohei < http://www.machu.jp/diary/ >

投稿者 xml-rpc : 2007年12月28日 23:23
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/68129
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。