2008年7月25日

[ruby-list:45259] nkf -j problem?

大原です。

NKF.nkf で JIS コードへの変換 (-j) で
変換結果が空文字列になってしまうケースがあるようです。
「鬱」や「掬」などを含んでいると空文字列になってしまいます。

% irb
irb(main):001:0> require "nkf"

=> false
irb(main):002:0> NKF::VERSION
=> "2.0.8 (2007-01-28)"
irb(main):003:0> NKF.nkf("-j", "鬱")
=> ""

少し古いバージョンで試してみたところ、正しく (?) 変換しているようです。

% irb_1_8_5
irb(main):001:0> require "nkf"
=> false
irb(main):002:0> NKF::VERSION
=> "2.0.7 (2006-06-13)"
irb(main):003:0> NKF.nkf("-j", "鬱")
=> "\e$B]5\e(B"


コマンド版の nkf で試したところ、
2.0.7 と 2.0.8 (CVS 先端) では変換しているようです。

% nkf --version
Network Kanji Filter Version 2.0.7 (2006-06-13)
Copyright (C) 1987, FUJITSU LTD. (I.Ichikawa),2000 S. Kono, COW
Copyright (C) 2002-2006 Kono, Furukawa, Naruse, mastodon
% nkf -j

% nkf-2/nkf-utf8/nkf --version
Summary of my nkf 2.0.8 (2008-02-08) configuration:
nkf identity:
$Id: nkf.c,v 1.179 2008/07/08 09:34:08 naruse Exp $
Compile-time options:
Compiled at: Jul 25 2008 09:45:07
Default output encoding: LOCALE (EUC-JP)
Default output end of line: LF
Decode MIME encoded string: ON
Convert JIS X 0201 Katakana: ON
--help, --version output: STDOUT
% nkf-2/nkf-utf8/nkf -j

----
OHARA Shigeki (大原 重樹) <os@xxxxx>


投稿者 xml-rpc : 2008年7月25日 09:59
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/75656
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。