2006年7月22日

[SpamAssassin-JP 291]SA日本語対応版(案)わかち書きプラグイン

** SpamAssassin メーリングリスト **
** 注意:このメールへの返信は SpamAssassin-jp へ行きます **
滝澤です。

現在、SA日本語対応版(案)ではわかち書きプラグインとしてKAKASIとMeCabを
利用していますがこれについて2点話があります。

まず、一つ目はMeCabについて。

牧大輔(dmaki)さんがMeCabのPerlバインディングであるText::MeCabを作成して
公開しています。
http://search.cpan.org/~dmaki/Text-MeCab/
MeCabの配布元でもmecab-perlというPerlバインディングを配布していますが、
SWIGの関係か環境によってエラーが生じたりします。
そのため、Text::MeCabを今後使おうと考えています。
Text::MeCabもちょっと問題があったのですが、現在は解決しています。
経緯はこれ。
http://d.hatena.ne.jp/t-tkzw/searchdiary?word=Text%3a%3aMeCab

二つ目はライセンスについて。
KAKASIのライセンスはGPLで、Text::KakasiもGPLです。
これはApache License 2.0とはどうにも相性が悪すぎます。グレーというか黒。
一方、MeCabはLGPLで、Text::MeCabはArtistic Licenseですので、
Apache LicenseであるSpamAssassinから利用する分には問題は発生しない
と思います。
そういうわけで、今後はSA日本語対応版および本家への投稿で行うわかち書き
プラグインはでMeCabのプラグインだけにした方がよいと思います。

以上のことについて、何か意見等ありましたら投稿をお願いします。

--
TAKIZAWA Takashi(滝澤 隆史)
http://www.emaillab.org/

--
SpamAssassin メーリングリスト
http://mm.apache.jp/mailman/listinfo/spamassassin-jp

投稿者 xml-rpc : 2006年7月22日 01:12
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/39816
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。