2008年7月26日

[Namazu-devel-ja 1752]filter/{msword, excel, powerpoint}.pl を pl/extutf8.pl を使用するように変更

寺西です。

filter/{msword, excel, powerpoint}.pl を pl/extutf8.pl を使用するよう
に変更しました。
Perl 5.8 以降か、NKF 2.04 以降の Perl モジュール、lv, unicode.pl の
いずれかが利用できれば UTF-8 に対応するので、従来のこれらのフィルタ
よりは柔軟な対応となっています。

この変更に伴い各フィルタにあった utf8_to_eucjp は削除しました。

また、非日本語の場合、UTF-8 がそのままフィルタを素通りすることがわか
りましたので、US-ASCII 文字以外は '#' に変換する処理を追加しました。

filter/ooo.pl 他も UTF-8 から EUC-JP へ変換する処理が含まれますので、
そのうちに pl/extutf8.pl を使うように書き換える予定です。
--
=====================================================================
寺西 忠勝(TADAMASA TERANISHI) yw3t-trns@xxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E

_______________________________________________
Namazu-devel-ja mailing list
Namazu-devel-ja@xxxxx
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-devel-ja


投稿者 xml-rpc : 2008年7月26日 16:41
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/75688
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。