1999年12月25日

[julius-u:00019] Re: text2speech (was Re: Re: [luky:06140] Julius-users ML オープン

osima@古賀です。

ML登録-> ポスト の後過去メールを読み大変なメンバーの所にポスト
した (--;; と肝が冷えました。 冷えたついでに

From: Nisimura Ryuichi <nisimura@xxxxx>
Subject: [julius-u:00018] Re: text2speech (was Re: Re: [luky:06140] Julius-users ML オープン
Date: Sat, 25 Dec 1999 03:07:34 +0900 (JST)
Message-ID: <19991225030734C.nisimura@xxxxx>

> Hisaaki Shibata <shibata@xxxxx>さん:
> > text2speechの方も、情報が集まればいいですよねぇ。
>
> 日本語音声合成は,私の知る限り,現在は,フリーのものはありませんが,
> 売り物では http://www.createsystem.co.jp/ があります.
> ぼくは,これを使っています.
>
> あと,ATRの開発している CHATR http://www.itl.atr.co.jp/chatr/)
> があります.これも売り物です.来年度版では,ライブラリ化されて
> プログラムに組込むのも楽になるそうです:-)Linuxでも動きます.

φ(..)

>
> 研究レベルで,フリーの音声合成エンジンをつくろうという話も
> あるので,近いうちに出るかもしれません.

学術的用語は判りませんが、音声合成/音声認識 などの高度な技術を
使わないで、今ある物で テキストを読み上げるる事できない物かと
"音声読み出し"
と言ってしまいました。最終的には 音声認識/音声合成技術で パソコン
の前で "cat" と言えば ファイルの内容が見え、庭で "cat" と言えば
飼猫がよって来る事を期待してます ;-)

DOS/MS-Winで実際に使われてるソフトで音声を聞く機会があったのですが
発音単語 "A" "あ" の組み合わせで単語と作って行く事を理解しました。
#音声認識とは関係ないのですが、視力障害の方々はまだ NEC/PC-AT DOS
でパソコンを使ってるかたが多くおられますが、ソフト開発は MS-Win
の方向で DOSソフト自体の改善は望めない状態です。
そのためイヤオウナク MS-Winに移行されてますがそのため マウス操作
や重なった窓の読みだ出しなど イラン操作が必要になっており、これ
なら DOSの不便な環境をそのまま UNIXの CUIに移行した方が良いと感
じました。ただ Linuxでの emacspeak/festival 環境が良いのかがわか
りません。

そこで私のやれる事で貧弱な環境でも出来る事を考えました。
特定の MLで書き込まれる 単語を わかち書きに分解し 単語表を作る。
それを ローマ字に変換し 単語を録音します。
これを音源として 文章の単語の文字列を 音源に書き換えたをファイルを作り
サンドカードに流します。


利点は "情報処理"などの単語は途切れる事なく聞こえ、助詞や 副詞
などは 適当に時間が空いて聞こえる事だと考えてます。

欠点 は 単語登録が.... (^^;;
編集などの知識がないのでその方面に関する部分に欠陥がある
かも知れません。

以上のように素人のやってる事ですので、とてつもなく原始的でここで
言うのも恥ずかしいので、ROM状態だと思いますがよろしくお願いします。

音声認識はパソコンの重要なインターフェス部だと考えますし、見る事
が不自由な方は必ず増加します(老人)ので期待いたします。

==========10=======20========30========40========50========60___5
\\川川 Linux Users KYusyu HTTP://WWW.LUKY.ORG/
ΘoΘ ML lucky@xxxxx
⊂ω⊃ MY-Address osima@xxxxx


投稿者 xml-rpc : 1999年12月25日 08:27
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/3657
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。