2009年12月 9日

[PHP-users 34868] Re:JISで文字列の置換を行いたい。


菊澤と申します。

ISO 2022では、文字集合の切り替え(ASCII→JIS X 0208/JIS X 0208→ASCII)で、
エスケープシーケンスが入りますので、文字列の編集には、向いていません。
一旦、UTF-8なりEUCに変換してやるのが、無難かと思われます。

示されたコードの出力では、


(1)萩山(2)(1)さん、こんにちは。(2)

となっていました。

(1)は、エスケープシーケンス(ASCII→JIS X 0208)、ESC ( B (1b 24 42)
(2)は、エスケープシーケンス(JIS X 0208→ASCII)、ESC $ B (1b 28 42)

EmEditorでは読めましたが、(2)(1)と連続する場合、読めないエディタも
あるかもしれません。

コードに、文字列をダンプする関数を入れてみましたので、
エスケープシーケンスの付き具合を確認できます。

<?php // -*- coding: utf-8 -*-

function string_dump($str)
{
$chars = array();
$codes = array();
for($i = 0; $i < strlen($str); $i++) {
$char = substr($str, $i, 1);
$codes[] = ord($char);
$chars[] = $char;
}
echo "<table cellpadding='2' cellspacing='0' border='1'>";

echo "<tr>";
foreach($chars as $char) {
if (!preg_match("/^[!-~]+$/", $char)) {
$char = "<span style='color:red'>?</span>";
} else {
$char = htmlspecialchars($char);
}
$code = dechex($code);
echo "<td align='center'>{$char}</td>";
}
echo "</tr>";

echo "<tr>";
foreach($codes as $code) {
$code = dechex($code);
echo "<td align='center'>{$code}</td>";
}
echo "</tr>";

echo "</table>";
echo "<br />\r\n";
}

$str='%%name%%さん、こんにちは。';
$pat='%%name%%';
$rep='萩山';

$str_jis=mb_convert_encoding($str,'iso-2022-jp','UTF-8');
string_dump($str_jis);
$rep_jis=mb_convert_encoding($rep,'iso-2022-jp','UTF-8');
string_dump($rep_jis);
$str_jis=str_replace($pat,$rep_jis,$str_jis);
string_dump($str_jis);

$fp = fopen('data.txt', 'w');
fwrite($fp, $str_jis);
fclose($fp);
?>


On Wed, 09 Dec 2009 14:24:50 +0900
choice <info@xxxxx> wrote:

> 中出と申します。
>
> 理由があってJISで文字列の置換を行いたいと
> 思っているのですが、うまくいきません。
>
> ●スクリプト
> <?php // -*- coding: utf-8 -*-
> $str='%%name%%さん、こんにちは。';
> $pat='%%name%%';
> $rep='萩山';
>
> $str_jis=mb_convert_encoding($str,'iso-2022-jp','UTF-8');
> $rep_jis=mb_convert_encoding($rep,'iso-2022-jp','UTF-8');
> $str_jis=str_replace($pat,$rep_jis,$str_jis);
>
> $fp = fopen('data.txt', 'w');
> fwrite($fp, $str_jis);
> fclose($fp);
> ?>
>
> スクリプトはUTF8で実装しています。
> 処理としては、JISの文字列から%%name%%を探し、置換を行い
> ファイルに保存するとなっています。
>
> ファイルには
> 「
> 萩山さん、こんにちは。
> 」
>
> と保存されることを期待するのですが、実際には
>
> 「
> 萩山[$B$5$s!"$3$s$K$A$O!#
> 」
>
> のようになりうまくいきません。
>
>
> なお、UTF8で置換を行い、その後、JISに変換して保存するという方法は
> 分かっているのですが、「JISで文字列の置換」が解消した問題なので
> この方法はパスしています。
>
> よい解消方法があれば教えてください。
> よろしくお願いします。
>
> ----
>
> _______________________________________________
> PHP-users mailing list PHP-users@xxxxx
> http://ml.php.gr.jp/mailman/listinfo/php-users
> PHP初心者のためのページ - 質問する前にはこちらをお読みください
> http://oldwww.php.gr.jp/php/novice.php3

--------------------------------------------
菊澤 正明 mailto:kikuzawa@xxxxx

_______________________________________________
PHP-users mailing list PHP-users@xxxxx
http://ml.php.gr.jp/mailman/listinfo/php-users
PHP初心者のためのページ - 質問する前にはこちらをお読みください
http://oldwww.php.gr.jp/php/novice.php3


投稿者 xml-rpc : 2009年12月 9日 15:59
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/91265
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。