2009年9月17日

[Namazu-users-ja 1176]xlhtml実行時のセグメンテーション違反について

はじめまして。
酒井と申します。

NAMAZUのフィルタ(xlhtml)に関して、
お伺いしたいことがあり、投稿させていただきました。

現在、NAMAZUのインデックス生成時の
「/var/log/messages」の記録に

Aug 31 17:06:09 hoge_host kernel: xlhtml[30785]: segfault at
0000000000613000 rip 0000000000406216 rsp 00007fff053ffaa0 error 4
(略)
Sep 17 02:40:35 hoge_host kernel: xlhtml[4545]: segfault at
0000000000000048 rip 0000000000405a0f rsp 00007fffc31e6b30 error 6
といった「segfault」が発生してしまっております。

時期からして、xlhtml0.5だとパスワードの掛かったExcelで無限ループして、
/tmpがあふれてにっちもさっちもいかない状態に陥る日々が続いたため、
それが改善されているらしきxlhtml0.5.1とそのパッチにてインストールしなおして、
インデックスが無事作成されることが確認した頃からです。
※0.5.1は下記URL先から取得
http://matsui.homeunix.com/index.php?FreeBSD%2FNamazu#f55c5305

現在も、差分に対する全体のインデックスの生成は問題はなく、
NAMAZU本体とWord・PDF・一般的なExcelに関する処理は行われているようです。

Excelファイルについては、すんなに処理が通っているものもあれば、エラーになるものもあります。
(ただし、エラーになって、処理は飛ばされていると見て取れます)
NMZ.err内の「TEST.xls Unable to convert file (/usr/local/bin/xlhtml error
occurred).」は、
大量のグラフや画像が貼り付けられていたりするファイルに多く見られます。

「segfault」の原因となっているファイルを直接HTML吐き出ししてみようとすると、
以下のような結果となります。
//----ここから---
$ xlhtml -m TEST2.xls > TEST2.html
セグメンテーション違反です
-----ここまで---//

/var/log/messagesには
Sep 17 14:52:10 hoge_host kernel: xlhtml[5458]: segfault at
0000000000000048 rip 0000000000405a0f rsp 00007fffb54249d0 error 6
といったようにログが吐かれます。

インデックスが作成されないためか、毎日同じファイルに対して
NAMAZU+xlhtmlがインデックス生成のアクションをかけるため、
同様のログが日々吐かれ続けております。

過去のML事例ではxlhtml-0.5に関する無限ループ対応、
「mknmzがセグメンテーション違反で落ちる」といったものを参照してみたものの、
今回の症状とは一致しているわけではなく、
解決にまでは至りませんでした。

サーバ上から、該当のxlsファイルを削除することは運用上困難であるため、
何らかの解決策がないかと、投稿させていただきました。

xlhtml-5.0.1以下に下げ、無限ループ防止のためのスクリプト改善を施すことが、
MLからの事例としては最適なのかもしれませんが、
これについて、xlhtml-5.0で試そうとしたところ、ソースが違うためか?
事例にあった編集箇所が見つけられず、断念した経緯があります。

NAMAZUではなく、xlhtmlの問題の場合は
こちらのMLへの投稿としてはふさわしくないでしょうか…

NAMAZUの実装等、手探り状態となっており、
情報の整理・状況説明に不備等あり、申し訳ない限りなのですが、
ご指摘・ご助言等頂けますと幸いです。

また、doccatのような有償ツールではなく、
無償のツールでxlhtmlの代用となるようなものをご存知でしたら、
お教えいただけたらと思っております。

よろしくお願い致します。


■以下、NAMAZU関係のインストールに関する情報です
●OS,アプリケーション(一部)

メモリ:4GB
OS:CentOS5.3
Linux hoge_host 2.6.18-128.el5 #1 SMP
Wed Jan 21 10:41:14 EST 2009 x86_64 x86_64 x86_64 GNU/Linux

Apache 2.2.3
Perl 5.5.8
make 3.81
gettext 0.14.6
nkf 2.07
NKF 2.07
KAKASI 2.3.4
Text::Kakasi 2.04
NAMAZU
┗File::MMagic
┗namazu本体 2.0.19
lv v.4.51.a (←Perl5.5.8だったので、既存のもの)
wvWare
┗(2.0.3.1)(←application/msword: msword.plとして認識されなかった)
┗1.2.5   (←2系の後、入れ直し)
xlhtml
┗(0.5) (←パスワード付きファイルに対して無限ループ発生)
┗0.5.1  (←無限ループ防止のパッチも配布されていたためインストール)
http://matsui.homeunix.com/index.php?FreeBSD%2FNamazu#f55c5305
xpdf 3.0.2pl3
xpdf-japanese

=====
●mknmz -Cの結果
$ /usr/local/bin/mknmz -C
読み込んだ設定ファイル: /usr/local/etc/namazu/mknmzrc
システム: linux
Namazu: 2.0.19
Perl: 5.008008
File-MMagic: 1.27
NKF: module_nkf
KAKASI: /usr/local/bin/kakasi -ieuc -oeuc -w
茶筌: no
和布蕪: no
わかち書き: /usr/local/bin/kakasi -ieuc -oeuc -w
メッセージの言語: ja_JP.UTF-8
言語: ja_JP.UTF-8
文字コード: euc
CONFDIR: /usr/local/etc/namazu
LIBDIR: /usr/local/share/namazu/pl
FILTERDIR: /usr/local/share/namazu/filter
TEMPLATEDIR: /usr/local/share/namazu/template
対応メディアタイプ: (40)
未対応メディアタイプ: (8) 必要ツールが $path にないものには (-) を表示
application/excel: excel.pl
application/gnumeric: gnumeric.pl
application/ichitaro5: taro56.pl
application/ichitaro6: taro56.pl
- application/ichitaro7: taro7_10.pl
application/macbinary: macbinary.pl
application/msword: msword.pl
application/pdf: pdf.pl
- application/postscript: postscript.pl
application/powerpoint: powerpoint.pl
- application/rtf: rtf.pl
application/vnd.kde.kivio: koffice.pl
application/vnd.kde.kpresenter: koffice.pl
application/vnd.kde.kspread: koffice.pl
application/vnd.kde.kword: koffice.pl
application/vnd.oasis.opendocument.graphics: ooo.pl
application/vnd.oasis.opendocument.presentation: ooo.pl
application/vnd.oasis.opendocument.spreadsheet: ooo.pl
application/vnd.oasis.opendocument.text: ooo.pl
application/vnd.openxmlformats-officedocument.presentationml: msofficexml.pl
application/vnd.openxmlformats-officedocument.spreadsheetml: msofficexml.pl
application/vnd.openxmlformats-officedocument.wordprocessingml: msofficexml.pl
application/vnd.sun.xml.calc: ooo.pl
application/vnd.sun.xml.draw: ooo.pl
application/vnd.sun.xml.impress: ooo.pl
application/vnd.sun.xml.writer: ooo.pl
application/vnd.visio: visio.pl
application/x-apache-cache: apachecache.pl
application/x-bzip2: bzip2.pl
application/x-compress: compress.pl
- application/x-deb: deb.pl
- application/x-dvi: dvi.pl
application/x-gzip: gzip.pl
- application/x-js-taro: taro7_10.pl
application/x-rpm: rpm.pl
- application/x-tex: tex.pl
application/x-zip: zip.pl
- audio/mpeg: mp3.pl
message/news: mailnews.pl
message/rfc822: mailnews.pl
text/hnf: hnf.pl
text/html: html.pl
text/html; x-type=mhonarc: mhonarc.pl
text/html; x-type=pipermail: pipermail.pl
text/plain
text/plain; x-type=rfc: rfc.pl
text/x-hdml: hdml.pl
text/x-roff: man.pl

--
----------------------------------
酒井美那<ouji24@xxxxx>
_______________________________________________
Namazu-users-ja mailing list
Namazu-users-ja@xxxxx
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja


投稿者 xml-rpc : 2009年9月17日 20:56
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/88640
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。