2008年4月 7日

[Namazu-users-ja 1069] Re: gcnmz が非常な時間を要するようになった

寺西です。

"Hideyuki SHIRAI (白井秀行)" wrote:
>
> 最近、shimbun で作ったファイルを mknmz したことがなかったので実
> 験してみました。実験対象は Mew + 朝日新聞の rss 版ですが、他のも
> のでもほぼ一緒でしょう。
...

> > これは RFC2557 や mime 関連の RFC にきちんと準拠したフォーマット
> > となっているのでしょうか。
...
> 最近調べていませんが、ちゃんとした mime 形式のメールになっていま
> す :-)

RFC 準拠なら何とかしようもありそうですが。

> この辺は shimbun を 扱う MUA に依存する部分なのですが、Mew だと
>
> X-Shimbun-Id: asahi-html+rss:<20080407.NGY200804070001%national.rss.asahi.com>
>
> の様なヘッダーが必ず第一行目になります。ソースを読む限りでは、野

X- で始まるこれで判断するのは汎用性がないのでどうも気が進みません
けど...。

^MIME-Version:
^Content-type:
^Content-Disposition:
^Content-transfer-encoding:

あたりが含まれているような気がするので、これを SPECIAL で引っ掛けら
れませんかね?
その方が汎用性がありそうですし。

> というわけで、臼田さんのあげられたヘッダとは違っているので

これ以外にも、SPECIAL の方でも設定があるので、他のパターンでも引っ
掛けているのではないかと思います。

SPECIAL と ENTRY の両方、message/rfc822 と text/html の設定が有効
な場合、どういう優先順位でメディアタイプが決定されるのか調べて
いませんが...。

> > subject 部分が RFC2047 にそった mime エンコードがされていない
> > 生の UTF-8 ということであれば RFC にあっていないようにも思えます。

メールでRFC に従っていない実装なんて、ゴロゴロしていますからね。
困ったもんです。結局不具合の出たものに対応する形で処置を追加する
しかないでしょうね。

> ぼくもなんでそうやって混じっているのかわかりません。
> 実例(shimbun のパッケージ名とか記事のURIとか、そのファイルそのも
> の)が欲しいです。

全く、机上の空論状態では前に進みませんからね。
--
=====================================================================
寺西 忠勝(TADAMASA TERANISHI) yw3t-trns@xxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E

_______________________________________________
Namazu-users-ja mailing list
Namazu-users-ja@xxxxx
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja

投稿者 xml-rpc : 2008年4月 7日 14:44
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/71874
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。