2008年2月21日

[plamo:28918] PostgreSQL textsearch_ja モジュール関連

くわむらです

PostgreSQL用の日本語全文検索モジュールがリリースされ
ましたので、パッケージしました。形態要素解析にはmecabを
使います。
http://textsearch-ja.projects.postgresql.org/index-ja.html

MediaWikiに使ってみたいので、mecabはUTF8対応にして

います。データベースを作成の際に、
createdb -E UNICODE <dbname>
のようにエンコードを指定する必要があります。

残念ながら、MediaWikiはPostgreSQL8.3対応まだでした。
ただし、今月発行されるWebDBマガジンで、textsearch_ja
の記事がそのあたりらしいので、うまくすると近いうちにパッ
ケージできるかもです。

ついでに、最近リリースされた島根県CMSがPostgreSQL
対応なので、試してみようと ruby を更新しました。

なお、postgresql本体は、メッセージカタログに日本語を
追加しただけで、特に変更はしていません。

--
パッケージのアーカイブ場所:
http://www.linet.gr.jp/~juk/plamo/parts/4.22/
--
PostgreSQL 8.3.0 日本語NLSパッチとtextsearch_ja, mecab関連
Database/aaa_postgresql-8.3.0-i386-P2.tgz
Database/textsearch_ja-8.3.0-i386-P1.tgz
Text/mecab-0.97-i386-P1.tgz
Text/mecab-ipadic-2.7.0-i386-P1.tgz

Ruby-1.8.6
Lang/ruby-1.8.6-p111-i386-P1.tgz

--
Jun Kuwamura
rC Cn
^
~

投稿者 xml-rpc : 2008年2月21日 17:28
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/70135
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。