2011年1月 4日

[debian-users:54754] 日本語 man ページのテキストファイル変換について


北海道の 山中 と申します。
日本語 man ページをテキストファイルに変換する方法について質問させてくだ
さい。

英語の man ページ(例えば ls)であれば

$ man 1 ls | col -b > ls.1.txt


で ls のマニュアルページをテキストファイルに変換できますが、この方法で日
本語のマニュアルページををテキストファイルに変換すると、文字が化けたり空
白になったりして、日本語に変換できません。

以前にもこのような質問があったのかもしれないと思い、
debian-users Mailing List Archive
http://lists.debian.or.jp/debian-users/) のスレッドで Suject を眺めたの
ですが、それらしきものは確認できませんでした。
(過去の ML のデータは取得できなくなったのでしょうか?)

man のマニュアルページをよく見ると、-t オプション、-T オプションがあるの
がわかり、

$ man -t 1 ls > ls.1.txt

で PostScript のファイルに変換できるのが分かりましたが、それをどのように
すれば日本語のテキストファイルに変換できるのか見当がつきません。

http://packages.debian.org/ で PostScript 関連のパッケージを調べていくと、
ghostscript パッケージの /usr/bin/ps2txt が気になりました。
この /usr/bin/ps2txt は PostScript のファイルから日本語のテキストファイ
ルに変換することが出来るんでしょうか?


日本語 man ページをテキストファイルに変換する方法についてご存知の方がお
られましたら、アドバイスをお願いしたいと思います。

現在の環境は、以下のとおりです。
・Debian GNU/Linux 5.07 (lenny)
・インストール状況:「標準構成」のみで、KDE や GNOME といった
 デスクトップ環境はインストールしていません。
・「標準構成」に追加してインストールしたのは、以下のパッケージ
 のみです。
apache2, apache2-utils ,ruby, libapache2-mod-ruby
bind9
ddclient
deborphan
postfix, mailutils-pop3d
samba, samba-tools
sudo
telnetd

以上、よろしくお願いいたします。

------------------------------------------
山中 伸一 qgb00026@xxxxx


投稿者 xml-rpc : 2011年1月 4日 03:32
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/101062
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。