2002年1月28日

[julius-u:00114] Re: ARPA 標準形式

にしむら@奈良先端大です

Tatubou <tatubou@xxxxx>さん:
> が、本当に自分で想像している形式と一致しているか自信がありません。^^;
> もしどなたかご存知でしたらお手数ではございますが教えて頂けませんでしょうか。

> 今のところバイナリ変換前の語彙ファイルは以下のような書式なのではないかと
> 考えております。
>  \\data\\
>  ngram 0 = ****

>  ngram 1 = ****
>  ngram 2 = ****
>  \1-grams"
>  *** *** ***\n

ARPA形式言語モデルのサンプルのかわりに僕がちょっと前に作った
言語モデルを以下のところに置いておきます.あまり使えるものでは
ないかもしれませんが,ご興味がある方はお試し下さい.

http://spalab.aist-nara.ac.jp/~ryuich-n/NAIST-langm/
lm.2gram.arpa.gz (2-gram ARPA形式言語モデル)
rev-lm.3gram.arpa.gz (逆向き3-gram ARPA形式言語モデル)
lm.bingram.gz (上記二つから作ったJulius形式バイナリ言語モデル)
lm.vocab (語彙ファイル)
です.
---
西村 竜一 <nisimura@xxxxx>

投稿者 xml-rpc : 2002年1月28日 01:34
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/3752
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。