2007年2月10日

[Namazu-devel-ja 1490] Re: XPS 用フィルタ Re: Visio vdx 用フィルタ Re: visio2007.vdx ファイル問題

臼田です

On 2007/02/08, at 2:07, Tadamasa Teranishi wrote:

>>
>>> ただし、各ページの XML ファイルの文字コードが
>>> UTF16-LE BOM 付きでした。
>

> 手元では、このパターンしか知りませんでしたが、
>
>> WindowsXP で Microsoft XPS Document Writer
>> を用いて XPS ファイルを作成してみました。
>>
>> 本文が入っているファイルが UTF-16 ではなく UTF-8
>> で記録されていました。
>
> というパターンもあるわけですね。
>
>> 文字コードを決めてかかってはいけないようなので

HEAD の filter/xps.pl のチェックをしていて
問題を見つけましたので
UTF16-LE は Encode で判別させずに
文書の先頭部で判断してから変換するようにしました。

また、HEAD の nmzcat を使う場合 pl/
codeconv.pl からの guess_encode
呼出し部分に問題があったので修正をしました。

臼田幸生

_______________________________________________
Namazu-devel-ja mailing list
Namazu-devel-ja@xxxxx
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-devel-ja

投稿者 xml-rpc : 2007年2月10日 15:04
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/54095
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。