2008年2月20日

[pgsql-jp: 39211]日本語全文検索 textsearch-ja のご紹介

板垣です。

PostgreSQL 8.3 用のデータベース組み込み型日本語全文検索モジュール
textsearch-ja のご紹介です。
http://textsearch-ja.projects.postgresql.org/index-ja.html

PostgreSQL 8.3 の新機能の中に、全文検索機能があります。
以前のバージョンでは contrib/tsearch2 と呼ばれていましたが、

8.3 にて本体に統合され、より洗練されました。
http://www.postgresql.jp/document/current/html/textsearch.html

多くの言語に対応しているのですが、残念ながらその中に日本語がありません。
そこで、日本語文書のためのテキストパーサを拡張モジュールとして作成しました。
textsearch-ja をインストールすることで、日本語文書も検索できるようになります。

全文検索拡張のための拡張モジュールは他にも既にありますが、
textsearch-ja の強みとしては、以下の点があるかと思います。

・tsearch2 を利用している欧米言語を対象とした製品を
大きく改変することなく、日本語対応できる。
・GIN または GiST インデックスをベースにしているため、
全文検索用のインデックスがリカバリ可能。

詳しい使い方などは、前述のプロジェクトホームページをご覧ください。

------------------------------------------------------------
板垣貴裕 <itagaki.takahiro@xxxxx>

投稿者 xml-rpc : 2008年2月20日 16:21
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/69998
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。