2007年12月 1日

[Namazu-users-ja 1013] Re: ゞ を含む text/html 形式のファイルで mknmz がエラーを吐く

寺西です。

野宮 賢 / NOMIYA Masaru wrote:
>
> 寺西さん> text/plain でも発生しますか?
> 寺西さん> 再現可能な最小限のファイルをご提示ください。
>
> はい,ゞ を入力しただけの text/plain ファイル(文字コードは,ISO-2022-JP)で

> も再現します.

そのファイル名を text.txt とした場合、

$ kakasi -w -ijis -oeuc < text.txt | od -tx1

の結果はどうなりますか?

KAKASI のバージョンは?
Text-KAKASI, KAKASI はソースからインストールしましたか?

> 寺西さん> Text-Kakasi を使わないという手はあるかもしれません。
>
> 確かに,Text-Kakasi を外すと,無事 INDEX が作成されました.

ChaSen なり MeCab を使うとという意味です。

問題の切り分けに Text-Kakasi ではなく、KAKASI を使ってみるというのも
方法ですけど。
--
=====================================================================
寺西 忠勝(TADAMASA TERANISHI) yw3t-trns@xxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E

_______________________________________________
Namazu-users-ja mailing list
Namazu-users-ja@xxxxx
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja

投稿者 xml-rpc : 2007年12月 1日 18:05
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/67083
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。