2004年11月 5日

[linux-users:103782] Re: [linux-users:103760] サーバーの突然のリブートについて

小川と申します。お返事が遅れ申し訳ございません。

> サーバで突然の再起動に見まわれた事(何度も)がありますが、原因は判り
> ませんでした。
> LAN カードを2枚付けると不安定になる機械もありました。
> 関連の有無は判りませんが
> kernel-2.4.27 の General setup に
> CONFIG_OOM_KILLER
> (Select task to kill on out of memory condition)
> の設定があります。

> 最近、この設定をしてあるサーバで実行中のコマンドが強制終了されたと
> 思われる状況が時々発生します。
> またsmtp サーバでも子プロセスの数を制限していますが、時々上限には
> りつきます。
>
> 小川さんの管理しているサーバでも、外生のイベントなどでのプロセスの
> 起動が起こるとメモリなど原資が枯渇しているのかも知れません。

早間様ありがとうございます。WEBサーバーとして利用しておりますが、MRTGなどのサーバ監視ツールを確認する限り、CPUのロードアベレージやメモリーには十分な余裕があるようです。ハードに依存する場合もあるということですので、今後とも状況を確認していこうかと考えております。


> Intel系のサーバじゃないですが、CPUキャッシュのパリティエラーでクラッシュ、リ
>
> ブートしたことがあります。エラーの瞬間のプロセスが不運だとログ書かないみたいで
> す。。。

石井様ありがとうございます。なんのログもはいていないのに突然再起動しているという現状を考えますと、石井様のご指摘の様なことが起こっていたのかもしれません。


>  コンピュータの突然の再起動は、ほとんどのケース、ハードウェアの
> 問題だと思われます。
>
>  もちろんソフトウェアの問題も考えられますが、私の今までの経験では
> ほとんどがハードウェアに起因するものでした。
>
>  ソフトウェア(ドライバなど)が起因する場合、たいていログや、Core
> など、手がかりになるものが残ります。(100%ではないですが)
>  これはどんな OS でもほぼ同じことが言えます。
>
>  Dellであれば、起動時にDiagnostics Utility を F10 か何かを押すことで
> 起動できるはずですので、そこでハードウェアのチェックをしてみることを
> おすすめします。
>
>  ご参考までに。

安藤様ありがとうございます。探す限りではログへの出力やCoreファイルの作成などはされていないようです。
ご指摘のハードウェアーチェックを行ってみたいと思います。

> 細井です。
>
> 当方の自宅サーバーも3ヶ月に一度くらいの割合で再起動がかかっています。
> (^^;
>
> Logを見ても特になにもないように見えMemTestでもエラーもないしあきらめてい
> たのですがそういう方もいらっしゃるんですね...
> (ちょっと安心しました)

細井様ありがとうございます。3ヶ月に一度の割合を見ますとかなりの頻度に感じます。

私も、たまたまログを確認していて今回気づいたわけでして、他にも再起動が発生していないか、しっかりログを確認しようと思っております。


> カーネル古すぎ。
> http://www.turbolinux.co.jp/security/index8s.html
>
> 古いカーネルを使い続けなければいけない特別な理由があるのでしょうか。
>
> 実は、サーバと言っても、UPS なんぞ繋がってなくて、ただの停電
> というオチだったりして。

Fukuichi様 ありがとうございます。サーバーのほうはハウジングに設置してあり電源ラインを二つ確保しているため、停電の可能性はないと思います。問題なのは私の技術が非力な点でして、カーネルのアップデートは早速行いたいと思います。


今回質問をさせていただき、いろいろな指摘をいただき、落ちないサーバーを作るには幅広い知識をもたなければならないと実感しております。まずはご指摘いただいた点を確認してみようと考えております。


投稿者 xml-rpc : 2004年11月 5日 17:26
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/27562
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。