2002年1月28日

[julius-u:00112] ARPA 標準形式


いつもおせわになっております。
たつぼうです。mOm

今辞書の語彙を絞ることで動作の高速化はできないものかと思い
語彙ファイルの中身をバイナリからテキストに逆変換しようと
しているのですが、ARPA標準形式というのがどういった書式
なのかわからないためソースから読み取ろうとしています。

が、本当に自分で想像している形式と一致しているか自信がありません。^^;

もしどなたかご存知でしたらお手数ではございますが教えて頂けませんでしょうか。

今のところバイナリ変換前の語彙ファイルは以下のような書式なのではないかと
考えております。
 \\data\\
 ngram 0 = ****
 ngram 1 = ****
 ngram 2 = ****
 \1-grams"
 *** *** ***\n

ちょっと自信がないので、どなたかよろしくお願い致します。mOm


投稿者 xml-rpc : 2002年1月28日 01:14
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/3750
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。