2008年12月25日

[vine-users:079053] Re: Vineの挙動がおかしい:サマリー投稿

梅田です。

大分遅くなりましたが、サマリー投稿を
致します。皆様、回答レスを有難うござ
いました。

<結論>

hdc(VineLiuxの入ってるHDD)の物理的故障
現在修理中。


<現象>

(1)ログイン名、パスワード入力して
   からの立ち上がりが、異常に遅い
   (最初の、起動は特に問題なし)

(2)アプリケーションが一切、起動しない
(メニューやアイコンがマウス操作に反
   応しない)


(3)終了出来ない→セッションのロ
   グアウトが出来ない。強制終了
   (電源ボタンを押す)しか出来
   ない。

(4)電源を切ると、以下のメッセージが出て止まる。

   localhost login: end_request: I/O error,dev hdc,sector 29606053
end_request: I/O error,dev hdc, sector 29606061
end_request: I/O error,dev hdc, sector 29606069
end_request: I/O error,dev hdc, sector 29606053
end_request: I/O error,dev hdc, sector 84094949
prink : 20 messeges suppressed.
Buffer I/O error on device hdc2,logical block 10485763
lost page write due to I/O error on hdc2
end_request:I/O error,dev hdc,sectorv84095029
Buffer I/O error on device hdc2,logical block 10485773
lost page write due to I/O error on hdc2
end_request : I/O error,dev hdc,sector 208845
lost page write due to I/O on hdc2
end_request: I/O error on device hdc, sector 208885
Buffer I/O error, on device hdc2,logical block 5
lost page write due to I/O error on hdc2
end_request: I/O error on device hdc, sector 141242317
Buffer I/O error, on device hdc2,logical block 10485786
lost page write due to I/O error on hdc2
end_request: I/O error on device hdc, sector 141242317


Buffer I/O error, on device hdc2,logical block 10485786

・・・以下同様のメッセージが大量に流れる(hdcが壊れた?)

<当方の環境>

自作機

OS:hda(光学ドライブ)hdb(CentOS),hdc(Vine),hdd(Debian)

★加藤様よりアドバイス

SATAドライブの順番がおかしい。今回の件とは直接
関係ないかもしれないが、光学ドライブは最後に持
ってくるのが良い。

<対処方法>

(1)/etc/fstab

★長南様より

/etc/fstab を書き換えたのではありませんか

# あるいは、ほかのファイルかもしれませんが、hdb, hdc などと
# 最近書き込んだファイルはありませんか。


/etc/fstabはいじって居りませんでした。

※/etc/fstabとは?(ネット検索より)

/etc/fstab ファイルは、パーティションがデフォルトでどこに
マウントされ、どのファイルシステムがどういう順番でチェック
されねばならないか、ということを決定するために、いくつかの
プログラムによって使われます。

>それもダメなら、インストール CD の resucue モードか、Knoppix
> あたりでブートして、dmesg でハードディスクがなんというデバイス
> として認識されているかを調べて、/etc/fstab (あるいは、hdb などと
> 最近書き込んだファイル)を書き換えればよいのではないかと思います。

※もし、/etc/fstabなどを誤って、編集し、
 前述のような不具合が発生した場合には、
 当該HDDがなんと言うデバイスとして、認
 識しているかを確認し、編集する必要が
 有る。


> ハードディスクが SATA でなければ、デバイス名が hdb, hdc と
> いうこともあるかもしれません。

ハードディスクはSATAドライブで信号を取り、
IDE電源で、電源を供給しておりました。理由
は組み立て作業中、SATA電源が外れやすく、
上手く組めなかった為、HDDにはIDEからも
電源が取れるようになっていることを幸い
に信号:SATA、電源:IDEという、変則的
な組み方をしました。実験の結果、それで
動作したため、そのまま組み立てました。

※その結果、CentOS,Vineではhdb,hdcと認識
 してインストールされ、Debianではsddと
 認識されていました。長南様によれば余り
 気にしなくても良いとの事。

> いづれにしろ、dmesg でハードディスクのデバイスを調べるまでは同じです。
> ああ、それから、一番最初に結線などを確認した方がよいと思います。

※dmesgは大量の情報が一瞬で出てきます。
 コンソールターミナル画面等では上部
 は見えず、必用な情報が読めません。

ポイント: dmesg | less とすれば・・・

これなら、じっくり読めました。

> これも気になります。これは LVM とかいうものじゃありませんか。
> この行をコメントアウトしたら、どうなるでしょう。


★私のメールより(/etc/fstabの内容)

> LABEL=/ / ext3 defaults 1 1
> LABEL=/boot12 /boot ext3 defaults 1 2
> none /dev/pts devpts gid=5,mode=620 0 0
> none /dev/shm tempfs defaults 0 0
> none /proc proc defaults 0 0
> none /sys sysfs defaults 0 0
> LABEL=SWAP-hdc3 swap swap defaults 0 0
> /dev/VolGroup00/LogVol01 swap swap defaults 0 0

fstabをリネームして再起動し、新しい
fstabが出来るのでは?と思い込み、やっ
てみた。これは”絶対に”やってはいけ
ない!!!Xが起動しなくなり、 深みに
はまってしまいました。

★長南様のメールより

> > fstabは現在、fstab1になっております。
>
> 今現在 fstab がないのですか。だったら、まず fstab1 を(その内容で
> よいのなら) fstab にしなければ。
>
> Knoppix の場合は、ディスクのアイコンを右クリックし、Properties
> --> Device で Read Only のチェックを外せば、書き込めるように
> なるのではありませんでしたっけ。

システム起動→起動ファイルが無い→
システム情報収集→新規ファイル作成
のプロセスを期待してやりました。fs-
tab1は自力で元に戻せなくなってしま
いました。過去の投稿の拡大解釈は、
絶対にいけないと痛感いたしました。

ここで、加藤様に助けて頂きました。

> Vine の / パーティションが /dev/hdc2 なら、
> # mount -o remount,rw /dev/hdc2 /
> で、読み書きモード(rw)で再マウントすれば、その場で fstab1 を元ファイルに
> コピーできると思います。
> それでとりあえず、"直前の状態" には戻せると思います。 → 梅田さん

> 自分もよく分かりませんが、原因を切り分ける為に、コメントアウトに賛成で
> す。
>
> それでも正常に戻らなければ、やはりハードディスクの不具合を疑うべきでしょ
> うね。


これでコピーと

/dev/VolGroup00/LogVol01 swap swap defaults 0 0

のコメントアウトが出来ました。

※結果(私のメールより)

> 先程は、fluxboxだけ、不安定のような
> 事を書きましたがGNOMEで、Ctrl+F1〜6
> までを押すと無数のエラーメッセージが
> 並び異常なことは間違いないようです。
> 再びGUIに戻ると、今度はGNOMEでもア
> プリケーションが起動せず、フリーズ
> 状態になります。

> Ctrl+F1〜6

正しくはCtrl+Alt+F1〜F6ですね。仮想コンソ
ールです。

<加藤様より問い>
> > フリーズ状態というのは、特定のアプリケーションがマウス操作やキーボード
> > ショートカットを受け付けないという状態ですか?

> > それとも、fluxbox や GNOME のメニューから「アプリケーションが起動しな
> > い」亊そのものを指してるんですか?
> >

<梅田答え>

>
> マウス操作は、一切受け付けませんでした。
> メニューをクリックしても反応しません。
> 勿論、アプリケーションの起動も出来ませ
> ん。

---------------その後------------------------

> 仮想コンソールのエラーが再現して
> おります。見てみますと・・・
>
>
> ide:failed opcpde was :unknown
> end_request: I/O error, dev hdc,sector 141302277
> hdc: task_in_intr:status=0x51 { DeviceReady SeekComplete Error}
> hdc: task_in_intr:status=0x40 {UncorrectableError }, LBAsect=141302280, high=8 low=7084552,sector=141302277

★鈴木様のメールより

> このエラーメッセージは IDE Status レジスタの値に
> エラーが帰ってきているということだと思う(要するにハードウェア的に何か問題がある)ので、
>
> ・パーティション情報に嘘が書いてあり、それを元にしてフォーマットした(これはないでしょう)
> ・HDD に障害がある。
> ・IDE インターフェースに問題がある。
>
> のどれかだと思います。

結論から言えば、HDDの物理的破損(冒頭の結論)でした。

> 私なら、
>
> ・HDD から妙な音がしているのなら、その HDD は死にかけているので、
>  必要なデータのバックアップを速やかに始める。
> ・電源容量不足の確認
> ・IDEケーブルの接触不良確認
> ・IDE ドライバICが死にかけているかも
>
> などを確認します。

エラーメッセージから読み取れる事の
対応として、引用させて頂きました。
特に、最初の3つは、初心者でも出来
る事なので、特記したいと思います。

※山田様も同様なメッセージを何度も
 確認されております。

> HDDの不良の可能性が高いですね。
> 今迄同様のメッセージを何度も見て
>いますが、殆どHDDが駄目になってい
>たケースでした。

やはり、この時点でHDDの破損は決定的
だったと考えます。


★長南様のメールより

> > ide:failed opcpde was :unknown
> > end_request: I/O error, dev hdc,sector 141302277
> > hdc: task_in_intr:status=0x51 { DeviceReady SeekComplete Error}
> > hdc: task_in_intr:status=0x40 {UncorrectableError }, LBAsect=141302280, high=8 low=7084552,sector=141302277
>
> こういうエラーは、fluxbox だけでなく、Gnome のときも出ているのでは
> ないでしょうか。仮想コンソールに出ていないとしても、/var/log/messages
> あたりに書き込まれていませんか。

もう、既に読み込みも出来なくなって居りま
した。しかし、今回のようなエラーが出た時
に(読める物なら)/var/log/messagesを確認
するという、アドバイスだと考えます。
>
> それから、ハードディスク接続の変更を試すのなら、/dev/hdc などの
> デバイス名が変わることに気を付けてください。/etc/fstab や
> /boot/grub/menu.lst でデバイスをラベルや UUID ではなく、
> /dev/hdc などと指定している場合、デバイス名を書き換えないかぎり、
> 当然ながらブートに失敗します。とくに Debian は /dev/hdc などで
> 指定していたと思うので。

これも、実行する際は、ドライブの変更に伴う
デバイス名の変更があるので、/boot/grub/menu.lst
の編集を忘れずに行うようにします。


>
> ついでに、WindowMaker の設定ファイルですが、$HOME/GNUstep/ に
> あります。こういうことは、man ページの FILES セクションに
> 書いてあることが多いものです。
>

今後の、参考にさせていただきます。

> もう一つ。SATA の大きなハードディスクもあって、そこに Windows が
> 入っていたりするんですね。鈴木さんがおっしゃっていますが、
> ディスクが四つもあると、電源が足りないということも考えに入れなければ
> ならないのかもしれません。

古いケースで電源が400Wです。ショップでも
「ギリギリです」と注意されました。本メール
執筆時点で、HDDを3つではなく、大容量のHDD
を1つだけにする事で、改善を図る事にしまし
た(現在、納品待ち)。今後の参考に注釈を入
れますが、SATAのHDDは3つ。Linuxしか入れて
おりません。3つでも、ギリギリには違いない
ですが。

★Miyazaki様のメールより


> fsckを起動時に実行させるにはルートディレクトリに forcefsck というファイル名
> のファイルを作成して再起動するのが
> 簡単な方法です。もしまだ実行されてないなら下のリンク先あたりが参考になると思
> います。
>
> http://www.itmedia.co.jp/help/howto/linux/redhat7_2_ext3/03.html

forcefsckとは空のファイルで宜しいのでしょうか?試しにバーチャルマシン
に入ってるVineにroot権限でログインし、forcefsckという空のファイルを作
り、保存し、再起動したのですが、何も起こりませんでした。また、ファイル
にforcefsckとだけ書いて再起動させたのですが、これも何も起こりませんで
した。この点については、バーチャルマシンというイレギュラーな環境で実行
したので、Miyazaki様のコメントを頂けると有り難いです。

以上

梅田

--
Lawrence <lawrence999vz@xxxxx>

投稿者 xml-rpc : 2008年12月25日 16:36
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/80426
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。