2008年2月20日

[pgsql-jp: 39213] Re:日本語全文検索 textsearch-ja のご紹介

原田と申します。

textsearch-jaでは、Mecabによる分かち書きを利用するとのことですが、
8.3の全文検索機能を拡張すれば、N-gramベースの検索も
可能なのでしょうか。

原田

08/02/20 に ITAGAKI Takahiro<itagaki.takahiro@xxxxx> さんは書きました:
> 板垣です。
>
> PostgreSQL 8.3 用のデータベース組み込み型日本語全文検索モジュール
> textsearch-ja のご紹介です。
> http://textsearch-ja.projects.postgresql.org/index-ja.html
>
> PostgreSQL 8.3 の新機能の中に、全文検索機能があります。
> 以前のバージョンでは contrib/tsearch2 と呼ばれていましたが、
> 8.3 にて本体に統合され、より洗練されました。
> http://www.postgresql.jp/document/current/html/textsearch.html
>
> 多くの言語に対応しているのですが、残念ながらその中に日本語がありません。
> そこで、日本語文書のためのテキストパーサを拡張モジュールとして作成しました。
> textsearch-ja をインストールすることで、日本語文書も検索できるようになります。
>
> 全文検索拡張のための拡張モジュールは他にも既にありますが、
> textsearch-ja の強みとしては、以下の点があるかと思います。
>
> ・tsearch2 を利用している欧米言語を対象とした製品を
> 大きく改変することなく、日本語対応できる。
> ・GIN または GiST インデックスをベースにしているため、
> 全文検索用のインデックスがリカバリ可能。
>
> 詳しい使い方などは、前述のプロジェクトホームページをご覧ください。
>
> ------------------------------------------------------------
> 板垣貴裕 <itagaki.takahiro@xxxxx>
>
>

投稿者 xml-rpc : 2008年2月20日 17:47
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/70000
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。