2008年1月14日

[linux-users:107867] Re: ソフトウェアRAID5の障害によるカーネルパニック

こんにちは。北村と申します。

sdb1がおかしいことにより上がらない可能性が高いなら、
ハード的に抜いてしまってはどうでしょう?

それできれいに上がるなら、そのディスクがハード的におかしいか、
変なデータが書き込まれているのだとおもいます。

後者なら、ddで頭を書き潰すなりして再度追加すれば使えるように
なると思います。

逆にsdb1を抜いても上がって来ないなら、復旧は難しいと思います...
しかしなんでそうなったのかは疑問が残ります。
MDもかなり枯れて来た技術なので、こういうのは滅多に見ません。
メモリーとかCPUキャッシュにエラーがあったりしませんかね?
一度memtest86+等でメモリーテストすることをお勧めします。

ご参考までに。

--
きたむら

At Mon, 14 Jan 2008 07:11:56 +0900,
Yusuke wrote:
>
> rescueモードで起動し、/dev/md0の自動マウントをはずして起動したところ、
> 正常にlinuxが起動しました。
>
> 以下のように、/dev/sdb1デバイスがfaltyとなっているようです。
> この状態で/dev/md0をstart(run)し、/dev/sdb1をパリティから
> 復旧させる方法をご教授下さい。
>
> 宜しくお願い致します。
>
> [root@xxxxx ~]# mdadm --examine /dev/sda1
> /dev/sda1:
> Magic : a92b4efc
> Version : 00.90.00
> UUID : 18f233fa:30924c49:59199e7d:dbbea21a
> Creation Time : Wed Jan 25 23:02:50 2006
> Raid Level : raid5
> Raid Devices : 4
> Total Devices : 3
> Preferred Minor : 0
>
> Update Time : Sun Jan 13 20:13:25 2008
> State : active
> Active Devices : 3
> Working Devices : 3
> Failed Devices : 1
> Spare Devices : 0
> Checksum : c56a808e - correct
> Events : 0.66180609
>
> Layout : left-symmetric
> Chunk Size : 64K
>
> Number Major Minor RaidDevice State
> this 3 8 1 3 active sync /dev/sda1
>
> 0 0 8 49 0 active sync /dev/sdd1
> 1 1 8 33 1 active sync /dev/sdc1
> 2 2 0 0 2 faulty removed
> 3 3 8 1 3 active sync /dev/sda1
> [root@xxxxx ~]#
> [root@xxxxx ~]#
> [root@xxxxx ~]# mdadm --examine /dev/sdb1
> /dev/sdb1:
> Magic : a92b4efc
> Version : 00.90.00
> UUID : 18f233fa:30924c49:59199e7d:dbbea21a
> Creation Time : Wed Jan 25 23:02:50 2006
> Raid Level : raid5
> Raid Devices : 4
> Total Devices : 4
> Preferred Minor : 0
>
> Update Time : Sat Aug 25 12:56:04 2007
> State : active
> Active Devices : 4
> Working Devices : 4
> Failed Devices : 0
> Spare Devices : 0
> Checksum : c4ae01b4 - correct
> Events : 0.66035970
>
> Layout : left-symmetric
> Chunk Size : 64K
>
> Number Major Minor RaidDevice State
> this 2 8 17 2 active sync /dev/sdb1
>
> 0 0 8 49 0 active sync /dev/sdd1
> 1 1 8 33 1 active sync /dev/sdc1
> 2 2 8 17 2 active sync /dev/sdb1
> 3 3 8 1 3 active sync /dev/sda1
> [root@xxxxx ~]#
> [root@xxxxx ~]#
> [root@xxxxx ~]# mdadm --examine /dev/sdc1
> /dev/sdc1:
> Magic : a92b4efc
> Version : 00.90.00
> UUID : 18f233fa:30924c49:59199e7d:dbbea21a
> Creation Time : Wed Jan 25 23:02:50 2006
> Raid Level : raid5
> Raid Devices : 4
> Total Devices : 3
> Preferred Minor : 0
>
> Update Time : Sun Jan 13 20:13:25 2008
> State : active
> Active Devices : 3
> Working Devices : 3
> Failed Devices : 1
> Spare Devices : 0
> Checksum : c56a80aa - correct
> Events : 0.66180609
>
> Layout : left-symmetric
> Chunk Size : 64K
>
> Number Major Minor RaidDevice State
> this 1 8 33 1 active sync /dev/sdc1
>
> 0 0 8 49 0 active sync /dev/sdd1
> 1 1 8 33 1 active sync /dev/sdc1
> 2 2 0 0 2 faulty removed
> 3 3 8 1 3 active sync /dev/sda1
> [root@xxxxx ~]#
> [root@xxxxx ~]#
> [root@xxxxx ~]# mdadm --examine /dev/sdd1
> /dev/sdd1:
> Magic : a92b4efc
> Version : 00.90.00
> UUID : 18f233fa:30924c49:59199e7d:dbbea21a
> Creation Time : Wed Jan 25 23:02:50 2006
> Raid Level : raid5
> Raid Devices : 4
> Total Devices : 3
> Preferred Minor : 0
>
> Update Time : Sun Jan 13 20:13:25 2008
> State : active
> Active Devices : 3
> Working Devices : 3
> Failed Devices : 1
> Spare Devices : 0
> Checksum : c56a80b8 - correct
> Events : 0.66180609
>
> Layout : left-symmetric
> Chunk Size : 64K
>
> Number Major Minor RaidDevice State
> this 0 8 49 0 active sync /dev/sdd1
>
> 0 0 8 49 0 active sync /dev/sdd1
> 1 1 8 33 1 active sync /dev/sdc1
> 2 2 0 0 2 faulty removed
> 3 3 8 1 3 active sync /dev/sda1
>
>
> ----- Original Message -----
> Subject: [linux-users:107864] ソフトウェアRAID5の障害によるカーネルパニック
> Date: 2008年1月14日 6:12:41 (JST)
> From: Yusuke <linux-users@xxxxx>
> To: linux-users@xxxxx
>
> > 皆様
> >
> > 最近質問ばかりしているものです。
> > mdドライバを用いたRAID5ボリュームを使っているのですが、
> > これが壊れてしまったようでカーネルパニックが起きています。
> > 障害復旧の方法をご教授いただけないでしょうか?
> >
> > ■障害経緯
> > 4つのディスク(sda1,2,3,4)をmdドライバにてRAID5として構築(/dev/md0)。
> > その領域をmountし、sambaでWindows共有していました。
> >
> > Windowsから共有領域へzipファイルを100程度置き、同時に解凍を始めたら
> > 全てのLhaPlusが異常終了し、今回の現象が発生しました。
> >
> > ■システムバージョン
> > CentOS 4.5 (kernel 2.6.9-55.0.2.ELcustom)
> > samba 3.0以上
> >
> > ■やりたいこと
> > 障害が発生したRAID5ボリュームを復旧、もしくは可能な限り
> > データを吸い出したい。
> >
> > ■障害詳細
> > ブート時のコンソール出力を添付します。
> > また、rescueモードで立ち上げることも可能です。
> >
> > 以上、どうぞ宜しくお願いいたします。
> >
> >
>
> --
> ===============================
> 長谷川祐介 <yusuke@xxxxx>
>
>


投稿者 xml-rpc : 2008年1月14日 10:21
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/68582
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。