2011年1月29日

[ruby-list:47790] [].join.encoding # => #

5.5 です。

Ruby 1.9.2 で,[].join の文字コードが Encoding::ASCII-8BIT になる
ようです。

[].join.encoding # => #<Encoding:ASCII-8BIT>

Array#join は,典型的には文字の列を返してほしいので US-ASCII のほ

うが良さそうに思うのですが,なぜ ASCII-8BIT なのでしょうか。


これに気づいたのは,空配列を join したものを sqlite3 でデータベー
スに書き込んだときに,文字列ではない変なものが書き込まれてしまっ
たからです。

str1="".encode("US-ASCII")
str2="".encode("ASCII-8BIT")
require 'sqlite3'
DB=SQLite3::Database.new "hogehoge.sqlite"
DB.execute "CREATE TABLE words (word VARCHAR(255))"
DB.execute "INSERT INTO words (word) VALUES (?)", str1
DB.execute "INSERT INTO words (word) VALUES (?)", str2

上記のコードで,二つめのレコードには,謎のバイト列(?)が入り
ます。Firefox の SQLite Manager で見ると,「X''」のように見えます。

これは,SQLite3::Datababase に ASCII-8BIT な文字列を渡すのが悪い
のか,sqlite3 の動作が不適当なのか,どちらでしょうか。

使った Ruby とライブラリーは以下のとおりです。

ruby 1.9.2p0 (2010-08-18) [i386-mingw32]
sqlite3 (1.3.3 x86-mingw32)


投稿者 xml-rpc : 2011年1月29日 12:40
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/101653
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。