2010年3月24日

[openoffice:11927] Re: ふりがな関数エクステンションのWindows VistaおよびWIndows 7での動作確認のお願い

curvirgoです。

(2010年03月23日 07:59), Yoshiyuki Masutomi wrote:
> ですが、いろいろと検索してみましたがこの関数の目的からすれば、形態素解析を行ってそれをもとに
> 長音かどうかを判断せざるをえないと思うようになりました。
- snip -
> 都合よくMeCabでは「発音」として長音を「ー」として表示してくれるので、それを利用してからローマ字に
> 変換長音に関するルールを適用することは可能と思います。

> ただし、MeCabで解析した結果が正しくない場合は、やはり期待した結果と異なる事になります。
長音の処理を完全に廃止したHEPBURN関数と、MeCabを利用した日本語からのヘボン式ローマ字変換
J2HEPBURN関数を追加したパッケージを作成してみました。

http://sourceforge.jp/projects/waooo/wiki/ScreenShots/attach/furigana_0.6.oxt

J2HEPBURN関数は漢字かな混じり文からヘボン式ローマ字を生成します。
長音かどうかの判断に、MeCabの発音を利用しています。
その為、カタカナ文を変換しようとしても長音の処理をせずに出力されてしまいます。

また、IMM32 APIによるふりがな取得も廃止していますので、NAIST Japanese Dictionary for Furigana Extensionの
インストールが必須となります。
辞書を未インストールの状態でクラッシュしないように対処していますので、辞書上インストールの場合は
変換されないままの文字列が返されます。

たぼたぼさんが示した例の、箕面(ミノオ)は現在インストール可能なVersion 0.1では多分発音が(ミノウ)となるはずで、
ヘボン式ローマ字(J2HEPBURN関数)の変換結果は「mino」になると思われます。
尚、手元で作成中のVersion 0.2の辞書では、ほんの少し辞書をカスタマイズしているので(ミノオ)と返されるようにすることは可能です。

動作確認して頂ける方は改めてダウンロード&インストールして頂き、レポートをを宜しくお願いします。


MLホームページ: http://www.freeml.com/openoffice

----------------------------------------------------------------------
自分好みのMLを作成して気の合う仲間と情報を共有しよう♪
http://ad.freeml.com/cgi-bin/sa.cgi?id=fjrAd
-----------------------------------------------------[freeml by GMO]--


投稿者 xml-rpc : 2010年3月24日 19:14
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/94500
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。