2009年8月25日

[Namazu-users-ja 1162] Re:mknmzにてPDFインデックス作成できない maybe copying protectionの表示

寺西です。

森田 光貴 wrote:
>
> やはりPDFファイルはすべて変換できないようです。

そうですか、それならば

> 完全にこの結果からPDFファイルに問題があるのではなく
> 当方のxpdfの設定がおかしいとは思うのですが。。。

その可能性が高いですね。

> 念のためにpdftotextも実行しましたがすべてエラーでした。
> /usr/local/etc/xpdfrcには記載しているつもりなのですが。

この xpdfrc が読まれていないか、設定に問題があるということでしょう。

...で、すみません。タイプミスしていました。

> # pdftotext -enc ECU-JP Book2.pdf out.txt
> Error: Couldn't find unicodeMap file for the 'ECU-JP' encoding
> Error: Couldn't get text encoding

EUC-JP が正解ですので、ECU-JP ならエラーが出て当然です。済みません。
再度 EUC-JP で試してください。

> # pdftotext -enc ja_JP.eucjp Book2.pdf out.txt
> Error: Couldn't find unicodeMap file for the 'ja_JP.eucjp' encoding
> Error: Couldn't get text encoding
> # pdftotext -enc eucjp Book2.pdf out.txt
> Error: Couldn't find unicodeMap file for the 'eucjp' encoding
> Error: Couldn't get text encoding

Namazu-users-ja#1156 では見過ごしましたが、ja_JP.eucjp や
eucjp を xpdfrc に追加されていますが、どういう理由で追加されている
のでしょう。
これらは削除してください。

> 今回の検証に使用したPDFファイルを寺西様個人のアドレスに添付させていただきます。

わかりました。そちらは確認しておきます。
--
=====================================================================
寺西 忠勝(TADAMASA TERANISHI) yw3t-trns@xxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E

_______________________________________________
Namazu-users-ja mailing list
Namazu-users-ja@xxxxx
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja


投稿者 xml-rpc : 2009年8月25日 04:15
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/87864
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。