2007年11月 5日

[Namazu-users-ja 994] Re: namazuで透明テキスト付きPDF検索が出来ない


廣瀬と申します

At Mon, 05 Nov 2007 15:46:42 +0900,
masaaki watanabe wrote:
>
> 通常のPDF(Word等から生成したPDF)は検索出来るのですが、スキャナ等で読み
> 込み、e.TypistまたはScanPaperで透明テキスト付きPDFにすると検索してもHit

> しません。

namazuはpdfを検索するために xpdfに付属する pdftotextを利用しています。
pdftotext -enc EUC-JP sample.pdf sample.txt
などとして、うまく読み込めないファイルが正しくtxtデータに変換できているか確認してみてください。
うまく変換できていない場合は,残念ながらnamazuではインデクスすることはできません。

----
HIROSE, Yoshihide hirose@xxxxx
JIPPG'S BLACKLIST Project http://blacklist.jippg.org/

_______________________________________________
Namazu-users-ja mailing list
Namazu-users-ja@xxxxx
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja

投稿者 xml-rpc : 2007年11月 5日 16:56
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/66028
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。