2007年1月27日

[Namazu-devel-ja 1465] Re: msofficexml.pl におけるタグ間のスペース問題

臼田です

On 2007/01/27, at 0:19, Tadamasa Teranishi wrote:

>
> これは何とかなるのでしょうか?
> powerpoint2007.ppsx の検索結果は次のようになります。
>

> 19. Namazu のテスト (スコア: 22)
> 著者: test@xxxxx
> 日付: Fri, 26 Jan 2007 20:20:51 +0900
> Namazu のテスト test@xxxxx Copyright (C) 2000 - 200 7
> Namazu
> Project. All rights reserved. トピック 1 Namazu は手軽に
> 使えること
> を第一に目指した日本語全文検索システムです。このファイルはテス
> ト用
> /backup/work/development-2-1/namazu/tests/tmp-data/powerpoint2007.ppsx
> (58,097 bytes)
>
> ここの "2007" が "200 7" に分かれてしまっています。
> その理由は、元々 200x だった x を 7 に編集し
> て保存したためで、
> ファイルの中身は次のようにタグで分けられているためでしょう。

相変わらず仕様書を読んでいませんが
テキストボックスの範囲が txBody というタグで囲まれているので
その中のタグを消去する際にはスペースを加えないようにしました。

変更をコミットしています。

臼田幸生

_______________________________________________
Namazu-devel-ja mailing list
Namazu-devel-ja@xxxxx
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-devel-ja

投稿者 xml-rpc : 2007年1月27日 11:22
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/53386
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。