2006年2月17日

[Namazu-users-ja 700] Re: 半角カタカナ検索の制限事項について

寺西です。

shintani26@xxxxx wrote:
>
> 今更ですが、半角カタカナの検索について、マニュアルのどの項に
> 制限が書かれているのでしょうか?

特に記述されていないかもしれません。


残念ながら必ずしもあらゆる情報がマニュアル化できているわけではあり
ません。
マニュアルに記述のないものについては、メーリングリストで個別にお答え
する形となります。

> 過去のメーリングリストで確認したら半角カタカナによるキーワード
> 検索は対応していないとなっていました。

半角カナは全角に変換されてインデックス化されます。このため、
元文書にある半角カナと全角カナの区別はされません。
これは、全角カナで検索式を書いた時に、元文書の全角カナのものも
半角カナのものも両方ヒットすることを意味します。
(この辺りは、nkf の -X オプションの機能です。)

Namazu 2.0.X は内部の漢字コードが EUC-JP であるため、半角カナ
を取り扱いません。(今の UNIX では EUC-JP でも半角カナは普通に
使えますが、過去には表示できないものも多々あったためです。)

次に検索式に半角カナを入力した場合ですが、漢字コードの自動認識の
都合上、Shift_JIS で半角カナを入力すると EUC-JP の漢字と誤認
します。これは同じコードが割り当てられているので、入力文字列から
自動認識するのはそもそも困難なためです。

pnamazu では、検索式が Shift_JIS で書かれていると決め打ちして、
半角カナも検索式に記述できる携帯電話モードがあります。
--
=====================================================================
寺西 忠勝(TADAMASA TERANISHI) yw3t-trns@xxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E

_______________________________________________
Namazu-users-ja mailing list
Namazu-users-ja@xxxxx
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja

投稿者 xml-rpc : 2006年2月17日 13:16
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/31808
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。