2006年3月 2日

[SpamAssassin-JP 77] Re:SpamAssassin 3.1.0の日本語対応パッチ

** SpamAssassin メーリングリスト **
** 注意:このメールへの返信は SpamAssassin-jp へ行きます **
舘山です

情報ありがとうございます
私が使ってみたバージョンかなり古かった... 0.80 でした

MeCabはsourceforge.jp http://mecab.sourceforge.jp/)の方で最新を開発していたん

ですね。私古い方のページみてました(^^;

後で久保様のアドバイスを参考にして新しいバージョンを試してみます  

On Thu, 02 Mar 2006 00:17:09 +0900
Motoharu Kubo wrote:

> > MeCab のUTF-8の分かち書き環境に対応させて計測してみましたら
> > kakasiより若干速いようです
>
> お、早速MeCabにチャレンジされましたね:-) ありがとうございます。
>

    >8 チョキチョキ 8<

> o (技術的なことじゃないですが) MeCabのライセンスはLGPLで、変更は諸般の事
> 情で難しい、とのことです。SAはApacheライセンスなので、組み込むときには
> ライセンスのことも考慮しないといけないですね。この2つのライセンスの相
> 性はどうなんでしょうか>詳しい方
そうですね ライセンス問題ですか... この辺は私も苦手でして...



> なお、私のパッチでわかち書きする処理はsplitterという名前の関数に切り出し
> てあります。関数名が適当かどうかはともかく、こうしておくことで、わかち書
> きをする/しない、あるいはわかち書きのエンジンを取り換える、などというこ
> とが比較的容易になると思っています。
>
> # 舘山さんがこんなに早くMeCabにチャレンジしていただけるとわかっていた
> # ら、最初にこれらのことを書いておけばよかったですね。すみません。
いえいえ たくさん情報いただいてお腹いっぱい
まずは基本からということで ステップアップ出来ますのでありがたいです。
--
SpamAssassin メーリングリスト
http://mm.apache.jp/mailman/listinfo/spamassassin-jp

投稿者 xml-rpc : 2006年3月 2日 12:43
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/40814
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。