2006年1月29日

[Namazu-users-ja 655] Re: Namazu 2.0.15RC5動作確認 (Mac OS X 10.4.4)

甲斐です。

On 2006/01/28, at 21:00, Yukio USUDA wrote:


> 臼田です
>
> Yasuaki Kai wrote:

>
>
>> 2. 動作チェック(3)の結果について
>> 手元の html ファイルをもとに Namazu 2.0.15RC5
>> 使って
>> みました。
>> 検索はちゃんとできていますが、「著者: 不明」となってし
>> まいま
>> した。
>> 著者に html ファイル中の LINK タグの mailto:
>> 以下の部分を表示
>> させたいのですが。 Namazu 2.0.14_3 を Easy Package
>> からインス
>> トールしていたときにはうまく表示されていました。
>>
>>
>>
>
> tests/data/ja/html.html を下記のように修正して
> 試してみたところ
>
---

> 1. Namazu のテスト (スコア: 26)
> 著者: hoge@xxxxx
> 日付: Sat, 28 Jan 2006 20:52:31 +0900
> Namazu のテスト Namazu は手軽に使えることを第一に目指し
> た日本語全文検索システムです。このファイルはテスト用です。
>
> となりちゃんと著者が表示できました。
> 2.0.15 からは html 文書の中に
>
> があるとそちらの内容が優先されるように変更されているので
>
>
> というように著者名が空になった行が混ざっていると
> 「不明」になることがあるようにも思えます。
>
> 対象となるファイルに > ていないでしょうか
>

namazu による検索に利用した HTML ファイルはメールデータの
テキ
ストファイルを MHonArc で変換したものですが、ソースを確認
して
みると下記二つとも含まれるようになっていました。


ただ、一方だけが含まれるようにしてみましたが、結果は同じでし
た。著者は不明なままで、サブジェクトはファイル名となりました。

どうも MHonArc 形式の HTML ファイルになっていること
に原因があ
るようです。実際、下記に示す HTML ファイルの冒頭の1
行を削除す
ると、著者、サブジェクトを表示するようにはなりました。ただ、
要約部分にナビゲーション用のデータなども表示してしまいます。
多分、通常の text/html として認識されるため、namazu
のフィル
タで余分な部分が除去されないためだと思います。

Namazu 2.0.15RC5 の動作確認の意味からは、素の 2.0.14 の結
果と
比較すべきだと思いますが、それは別途行うとして、以下に私のと
ころで試してみた結果を書いてみました。
過去の記事を調べてみると、類似の現象について書かれたものもあ
りましたが、私には具体的な対応がよく分かりませんでした。

------------------------------------------------------------
■メールのデータファイル
※「From hoge@xxxxx」の行はメール毎の区切りとして
入れています。

From hoge@xxxxx
Date: Sun, 1 Jan 2006 00:30:19 +0900
From: Taro
Subject: MHonArc と Namazu の連携
To: Hoge ML

mhonarc による HTML ファイル作成と
mknmz によるインデックス作成


From hoge@xxxxx
Date: Mon, 2 Jan 2006 04:47:14 +0900
From: Jiro
Subject: Re: MHonArc と Namazu の連携
To: hoge@xxxxx

namazu により検索:
「著者: 不明」、サブジェクトがファイル名になる。

------------------------------------------------------------
■MHonArc によって作成された HTML ファイル
(msg00000.html)










MHonArc と Namazu の連携










[Date Prev][Date Next][Thread Prev][ href="msg00001.html">Thread Next][ href="maillist.html#00000">Date Index][ href="threads.html#00000">Thread Index]



MHonArc と Namazu の連携







  • To: Hoge ML <hoge@xxxxx>

  • Subject: MHonArc と Namazu の連携

  • From: Taro <taro@xxxxx>

  • Date: Sun, 1 Jan 2006 00:30:19 +0900








mhonarc による HTML ファイル作成と
mknmz によるインデックス作成














------------------------------------------------------------
■namazu による検索結果
$ namazu --early Namazu index
検索結果

参考ヒット数: [ Namazu: 2 ]

検索式にマッチする 2 個の文書が見つかりました。

1. msg00000.html (スコア: 33)
著者: 不明
日付: Sun, 01 Jan 2006 00:30:19 +0900
mhonarc による HTML ファイル作成と mknmz によるイン
デックス作成
/Users/kai/html/msg00000.html (2,198 bytes)

2. msg00001.html (スコア: 34)
著者: 不明
日付: Mon, 02 Jan 2006 04:47:14 +0900
namazu により検索: 「著者: 不明」、サブジェクトが
ファイル名になる。
/Users/kai/html/msg00001.html (2,196 bytes)

現在のリスト: 1 - 2

------------------------------------------------------------
■msg00000.html の先頭行を削除して namazu で検索した
結果
$ namazu --early Namazu index
検索結果

参考ヒット数: [ Namazu: 2 ]

検索式にマッチする 2 個の文書が見つかりました。

1. MHonArc と Namazu の連携 (スコア: 36)
著者: taro@xxxxx
日付: Sun, 01 Jan 2006 00:30:19 +0900
MHonArc と Namazu の連携 [Date Prev][Date Next][Thread
Prev][Thread Next][Date Index][Thread Index] To: Hoge ML
Subject: MHonArc と Namazu の連携
From: Taro
/Users/kai/html/msg00000.html (2,170 bytes)

2. msg00001.html (スコア: 34)
著者: 不明
日付: Mon, 02 Jan 2006 04:47:14 +0900
namazu により検索: 「著者: 不明」、サブジェクトが
ファイル名になる。
/Users/kai/html/msg00001.html (2,196 bytes)

現在のリスト: 1 - 2
------------------------------------------------------------
Yasuaki KAI, kai@xxxxx

_______________________________________________
Namazu-users-ja mailing list
Namazu-users-ja@xxxxx
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja

投稿者 xml-rpc : 2006年1月29日 20:54
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/30585
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。