2011年6月26日

[Namazu-devel-ja 1809] Re:podフィルタ

寺西です。

(2011/06/26 14:49), Shigekazu Aoyagi wrote:
> mediatype は IANA には規定がないようですので、rfc.plにならって
> text/plain; x-type=pod というように定義してみました。

他のフィルタでも、IANA にないようなものは、適当なものを定義して
使っていますので、それでいいのではないかと思います。


> magic については、pod に特徴的な文字列をいくつか addSpecials()で
> 登録したのですが、心配なのは登場位置です。

File::MMagic の枠組みでは判定処理の記述が難しかったり、
ユーザの判定処理を組み込むことができなかったりするので、
かゆいところに手がとどかない面はあります。
これについては機能追加ができないものかと思っています。

あるマッチングパターンにマッチした場合は、そのメディアタイプ
ではないといった否定系が定義できるだけで、多少楽になるような
気がしています。

それはさておき、
POD 文書と普通の HTML 文書を混在した環境で mknmz を実行する
のではなく、POD と、それ以外に分けてインデックスを作ると
いった運用で回避できるものと思います。

あとで HTML の方のインデックスとマージすれば検索は両方を対象
とすることもできます。(インデックスを分けたまま使うこともでき
ますし。)

POD のインデックスは、POD の文書ファイルだけを渡して、
インデックスを作って下さい。
この場合、POD フィルタで誤認される "text/html" を removeSpecials
して pod を addSpecials するようにすれば良いのではないかと
思います。

POD 以外のインデックスの方は、POD フィルタが走らないように
して、POD 以外のファイルを処理してください。
フィルタディレクトリを分けて切り替えるというのが楽でしょう。

私はこのような特殊なファイルを処理するようなケースでは、こういった
運用でカバーするようにしています。
--
=====================================================================
寺西 忠勝(TADAMASA TERANISHI) yw3t-trns@xxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E
_______________________________________________
Namazu-devel-ja mailing list
Namazu-devel-ja@xxxxx
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-devel-ja


投稿者 xml-rpc : 2011年6月26日 18:10
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/105015
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。