2006年6月22日

[Namazu-devel-ja 1104] Re: mknmz: text/plain に誤認識されアプリ固有フィルタが適用されない問題

寺西です。

SATOH Fumiyasu wrote:
>
> > バイナリファイルがテキストファイル扱いされて処理されるとあまりよい
> > 結果にならないのは確かですが、それと先のパッチで回避するのとは
> > 別の話です。
>

> 過去、
>
> http://www.namazu.org/ml/namazu-users-ja/msg03482.html
>
> といった見解を述べていらっしゃいましたが、
> それとの兼ね合いはどうでしょうか。

「バイナリファイルがテキストファイル扱いされて処理されるとあまりよい
結果にはならない」ということは否定していません。

その解決方法として先のパッチで回避するのはいただけないというだけです。

もしあるならば別の解決方法をとるべきです。
ただ、magic での判定であっても誤認する可能性がゼロではないので、
「バイナリファイルがテキストファイル扱いされて処理され不具合が起こる」
とか、「別のファイル形式のものを誤認により誤って処理され不具合が
起こる」といった危険性はどうしてもつきまといます。

> > 拡張子に依存する回避方法はいただけません。
>
> よろしければ、その理由を教えてください。

残念ながら拡張子でタイプを決定することはできないからです。
もちろん、ある環境下においては拡張子でタイプを決定できる場面は多々
あります。
しかしながら、Namazu が利用される環境は特定できないので、拡張子で
タイプを決定するのは避けるべきです。
同じ拡張子で中身が違うものや、拡張子がなくリソースがある Mac ファイル
等もあるわけですから。
# 今後増えはしないでしょうけれども。

> > 将来的(2.2系)は checktype_byfilename の判定は廃止したいと考えています。
>
> 具体例を知らないですが、それだとファイルフォーマットでは
> 差がなく(差を判定できない、もしくは困難)、ファイル名でのみ
> アプリケーションが特定できるファイルに対応できなくなるので、
> 反対です。

というよりファイル名でのみアプリケーションを特定しなければならない
ものを排除したいという考えです。

また、対応できないわけではなく -t オプションで回避もできます。

> よい例ではないかもしれませんが、例えば ODF 形式
> (OpenOffice.org のファイル) のファイルは、実は ZIP 形式な
> ファイルでもありますよね。このようなケースに対応できるの
> でしょうか?

このような場合(Office文書もそうです)、
ZIP 等は大分類として分類し、その亜種を更にチェックして特定するか、
先に亜種バージョンのチェックを順に行い、最後に大分類のZIPの
チェックを行うということになるでしょう。
(今後は、チェックの順番というのも重要になります。)

いずれの場合でも、亜種のチェックが必要になりますが、これは先の
メールにも書きましたが、addContainerHook を使えばどのようにでも
チェックは可能でしょう。

それでもなお困る場合は -t オプションの出番です。
--
=====================================================================
寺西 忠勝(TADAMASA TERANISHI) yw3t-trns@xxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E

_______________________________________________
Namazu-devel-ja mailing list
Namazu-devel-ja@xxxxx
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-devel-ja

投稿者 xml-rpc : 2006年6月22日 02:22
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/40324
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。