1999年12月25日

[julius-u:00020] Re: text2speech (was Re: Re: [luky:06140] Julius-users ML オープン

今井と申します.

私の音声関係の知識と言ったら,フーリエ解析とニューラルネットワークをかじっ
たぐらいで,音声認識の仕組みも理解していないのですが.
# ウェーブレット変換も「直交変換の1つ」ぐらいの理解しかないです (^^;;

At Sat, 25 Dec 1999 08:27:40 +0900,
osima@xxxxx wrote:

> そこで私のやれる事で貧弱な環境でも出来る事を考えました。

> 特定の MLで書き込まれる 単語を わかち書きに分解し 単語表を作る。
> それを ローマ字に変換し 単語を録音します。
> これを音源として 文章の単語の文字列を 音源に書き換えたをファイルを作り
> サンドカードに流します。
>
>
> 利点は "情報処理"などの単語は途切れる事なく聞こえ、助詞や 副詞
> などは 適当に時間が空いて聞こえる事だと考えてます。
>
> 欠点 は 単語登録が.... (^^;;
> 編集などの知識がないのでその方面に関する部分に欠陥がある
> かも知れません。

現在あるシステムでも,このあたりは音声認識と組み合わせると解決できるかも
しれません :-)
つまり,音声認識した時点で単語登録プログラムを呼び出すようにしてみたらど
うかな,と.

例えばセンテンス単位で音声認識した時点で,実際の波形と音声合成辞書を比較
して,誤差が大きい単語だけ自動的に登録してみる,とか.

すると,「音声認識させればさせるほど流暢に音声合成するようになる」ような
システムになるかもしれません.

ただ,そうなると自分の声で喋るシステムになってしまいそうで,ちょっとイヤ
ンなのですが.

最終的には「音声認識辞書で音声合成する」というあたりが根元的な解決案かも
しれませんね.
おそらくは話者固有の情報を付加する必要はあるのだとは思いますが.
逆に,話者情報だけ入れ替えると別の声で音声合成する,というのも面白いかも.

# 職場のとあるオネーサマは「みやむーの声で音声合成させてみたい」などと
# のたもうておりましたが.

ちなみに,私自身は「あー,いー,うー」,なんていう母音の音声合成はやった
ことがあります.
とはいってもフォルマント周波数をサイン波で出しただけですが.

昔,FM-7 でやってたら友人が気味悪がってました (^^;;


ところで,肝心の julius 自身ですが,ftp で配布はされていないようですね.
CD-ROM の配布も終了しているようですし.
web に書いてあったメイルアドレスに問い合わせればよいのでしょうか.
# CD-R でも焼いて送ってもらえるのでしょうか (^^;;

では
_._. __._ _.. . .___ ._. _____ _... ._ _._ _.._. .____ .__. ... . _._

今井 邦彦
Kunihiko IMAI

投稿者 xml-rpc : 1999年12月25日 10:57
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/3658
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。