2010年12月 2日

[ruby-list:47671] Re: 文字列中に含まれる 8 進数表記 "\nnn" というパターンに正規表現でマッチさせたい

斎藤さん

金子です。

非常にわかりやすい説明、ありがとうございました。
"\126\145\162\056\061\056\060\061\040\000\243" を試してみて、目から鱗が落ちました。

[[:print:]] のような文字クラスの存在だけは知っていたのですが、このように使えるのですね。

「printable ではない文字」、まさにそれだけを区別する方法が欲しかったものでした。
おかげでいま抱えている問題を解決できる見通しが立ちそうです。ありがとうございました。


2010年12月2日2:55 Tadashi Saito <shiba@xxxxx>:
> 斎藤と申します。
>
> ざっくり省きますが、
>
> On Thu, 2 Dec 2010 02:25:51 +0900
> Kensuke Kaneko <kyanny@xxxxx> wrote:
>
>> 1. 文字列に含まれる "\nnn" というパターンに正規表現でマッチさせることは可能なのでしょうか?
>> 2. 可能である場合、どのような正規表現を書けば良いのでしょうか?
>> 3. 不可能である場合、 "\nnn" というパターンのみを文字列から削除する良い方法はないでしょうか?
>
> irbに
> "\126\145\162\056\061\056\060\061\040\000\243"
> などと入力したら、理解が深まるのではないでしょうか。
>
> つまり
> ・あらゆる文字列はバイト(数値)の連なりであり
> ・1バイトは\nnnという8進数で表記できるため
> ・すべての文字列は\nnnの連なりで表せる
> ということになります。
>
> 金子さんのおっしゃる「"\nnn" というパターン」とは何か、というのをじっくり考えてみる
> と、見えてくるものがあるのではないでしょうか。
>
> それで、結論を先回りすると、それはprintableでない文字を差すような気がします。もし
> それが金子さんの欲するものであれば、
> somestring.split(//).select{|c| c =~ /[[:print:]]/}.join
> で大丈夫なはずです。(ちなみにマルチバイト文字は、また別のお話になります。)
>
> --
> 斎藤ただし
>
>

--
Kensuke Kaneko <kyanny@xxxxx>


投稿者 xml-rpc : 2010年12月 2日 21:28
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/100438
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。