2011年7月26日

[Namazu-devel-ja 1872] Re:stable-2-0 に 2.0.21 を反映

さとうふみやす @ OSSTech です。

At Tue, 26 Jul 2011 06:43:44 +0900,
Tasamasa Teranishi wrote:
> > チェック前の正規化というのはどのレベルのものでしょうか?
> > 英数字の全角半角変換は入っていたかと思います。
>
> UNICODE の正規化という話です。

>
> http://ja.wikipedia.org/wiki/Unicode%E6%AD%A3%E8%A6%8F%E5%8C%96
>
> たぶん Namazu では NFC で正規化したものを扱うというのが
> 良いのだろうと思いますが。
>
> で、UNICODE の正規化には、GPL ライセンスと互換性があるICUが
> 使えないかと思っています。

Perl の Unicode::Normalize は使えないでしょうか。Perl 5.8.x なら
標準で入っています。(そろそろ Perl 5.8.1 未満は切り捨ててもいいような)

Perl 標準ではないですが Encode::UTF8Mac に Unicode::Normalize::Mac が
含まれていて、いわゆる(?) UTF-8-Mac に対応しています。

http://d.hatena.ne.jp/tomi-ru/20101219/1292733779

--
-- Name: SATOH Fumiyasu (fumiyas @ osstech co jp)
-- Business Home: http://www.OSSTech.co.jp/
-- Personal Home: http://www.SFO.jp/blog/
_______________________________________________
Namazu-devel-ja mailing list
Namazu-devel-ja@xxxxx
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-devel-ja


投稿者 xml-rpc : 2011年7月26日 11:25
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/105217
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。