2002年1月 2日

[julius-u:00107] 辞書について


はじめまして。
たつぼうと申します。mOm

最近ライブラリを使って色々試行錯誤させて頂いております。^^
#Windows 版を使わせて頂いております。
#ゲームや自作アプリに何か使えるんじゃないかと思いまして。^^;
#ちなみに音声認識そのものはやったことないのでズブの素人です。^^;;


この辞書について伺いたいのですが新たな単語を追加する為には
 ・語彙データ・・・20k.htkdic.gz
 ・辞書データ・・・75.20k.1-1.10p.wit.bingram.gz
の両方をいじる必要があるのでしょうか?

辞書データの方は中がどうなっているのかまったくわからないため、
今は語彙データを弄って見ています。

見かけ上「同じ発音の単語」であれば手動で追加して重み係数と
思しき数値を手直ししてやるだけでそれらしく動いているのですが、
そうであるならば辞書データの役割というのはどういったものに
なりますでしょうか。

ドキュメントや過去のMLの内容から察するに単語の前後関係情報等を
保持してそこからどの単語が適切かを推定するために使用している
様に思われるのですが、配布して頂いたものは既にバイナリになって
いるためわかりません。

もし差し支えなければ
 ・どういったデータなのか
 ・学習方法
 ・学習用のアプリの有無
 ・自作の可否
等教えて頂けませんでしょうか。

お忙しいところ素人丸出しの質問で恐縮ですが、よろしくお願いいたします。


投稿者 xml-rpc : 2002年1月 2日 22:25
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/3745
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。