2011年8月27日

[Namazu-devel-ja 1886] Re: Devel::NYTProf

青柳です。

古い話で恐縮ですが……

On Tue, 5 Jul 2011 00:50:57 +0900
Yukio USUDA <m6694ha392t@xxxxx> wrote:

> $ diff -u scripts/mknmz.org scripts/mknmz

> --- scripts/mknmz.org 2011-07-05 00:00:36.000000000 +0900
> +++ scripts/mknmz 2011-07-05 00:28:32.000000000 +0900
> @@ -2250,8 +2250,9 @@
> my %tmp = ();
> $$contref =~ s!\x7f */? *\d+ *\x7f!!g; # remove tags of weight
> $$contref =~ tr/\xa1-\xfea-z0-9 \n//cd; # remove all symbols
> + $$contref =~ s/^\s+//;
> + $$contref =~ s/\s+$//;
> my @words = split(/\s+/, $$contref);
> - @words = grep {$_ ne ""} @words; # remove empty words
> my $word_b = shift @words;
> my $docid = $docid_count + $docid_base;
> for my $word (@words) {

上記ですが、$$contref が例えば " a b c " だったときに、split の
結果が ( '', 'a', 'b', 'c', '' ) となることを想定しての処理と
解釈いたしました。

しかし、perl の split は実際には ( '', 'a', 'b', 'c' ) を返して
きますので、末尾の空文字列は生成されません。ですので

> + $$contref =~ s/\s+$//;

は無くても動作には影響がないのではないかと思います。

# だた、そうするとかなりダーティなコードになりますので
# 可読性の面からは削除しない方がいいのかもしれませんが。
--
Shigekazu Aoyagi <aoyagi@xxxxx>

_______________________________________________
Namazu-devel-ja mailing list
Namazu-devel-ja@xxxxx
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-devel-ja


投稿者 xml-rpc : 2011年8月27日 15:06
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/105906
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。