2007年11月 5日

[Namazu-users-ja 996] Re: namazuで透明テキスト付きPDF検索が出来ない

廣瀬と申します
pdftotext unkown font tag
でgoogle検索すると
http://www.namazu.org/ml/namazu-win32-users-ja/msg01415.html
に,似たような状況が乗っていますが、いかがでしょうか。
要するに,日本語が正しく設定されているか、ということです。
正しくインデックスできていたと思われる日本語のPDF書類を

pdftotext -enc EUC-JP sample.pdf sample.txt

してみて、再確認してください。
エラーがでるようなら,エラーの一部ではなく,全部を送ってください。

----
HIROSE, Yoshihide hirose@xxxxx
JIPPG'S BLACKLIST Project http://blacklist.jippg.org/


At Mon, 05 Nov 2007 17:12:31 +0900,
masaaki watanabe wrote:
>
> 返信有難うございます。
> 今やってみたのですが・・・
>
> ---一部抜粋---
> Error: Unknown font tag 'F0'
> Error (55822): No font in show
> Error (55822): No font in show
> Error (55822): No font in show
> Error (55825): No font in show
> Error (55827): No font in show
> Error (55831): No font in show
> Error (55834): No font in show
> Error (55838): No font in show
> ---一部抜粋---
>
> とエラーが出まくりです。
> -enc Shift-JISでも同じ。
> 色々なHPを探すとOCRソフトで透明テキスト付きPDFにするとnamazuで検
> 索出来るような感じらしいのですが・・・・
> 透明テキストにするソフトが良くないのでしょうか?
> スキャンしたPDFをnamazuで検索するには何か方法はありませんでしょうか?
> お願い致します。
>
_______________________________________________
Namazu-users-ja mailing list
Namazu-users-ja@xxxxx
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja

投稿者 xml-rpc : 2007年11月 5日 17:54
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/66034
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。