このスレッドは未解決です(解決したらこちらで解決済にしてください)
<<戻る

異常の検知 このメッセージに返信する
日時: 2010/08/06 12:08
名前: 暑さで溶けた
URL:
いつもお世話になっております。

掲示板の過去ログに異常終了時にメールを送信するなど大変興味深く実用的なものを見つけ、過去に発生した異常も対応してみようと思って四苦八苦しております。

サーバー側でWebにアクセス出来なくなったり、夏の暑さで熱暴走でおかしくなった場合に自動で再起動をかけれればと思っております。(熱暴走時はFANの故障でしたが)
これはmessagesを定期的に監視してエラーを判別して再起動を行えばよいかと思っておりますが、熱暴走時やパニックなどになった場合の判別も同じようにmessagesに吐かれるものなのでしょうか?
去年のことなのでどういったログが出力されるのかが不明なので質問させていただきました。
それとも何かデーモンなどでそういったことをまとめて監視しているようなものなのでしょうか。
記事編集 編集
Re: 異常の検知 このメッセージに返信する
日時: 2010/08/06 14:46
名前: stranger
URL: http://ja.528p.com/
kernelパニックなら真下の「再起動中にフリーズ」のところで
方法が語られています
熱暴走なら lm_sensorsでマザーボードのセンサーチップが認識できるものなら
基板やCPUの温度を検知して熱暴走前に止めるようなスクリプトを書く

シリコンチップは150度Cが限界 その前にCPUとしての限界温度が
メーカによって決められています
それをこえたら壊れるので、再起動でなく止めます

熱暴走したらkernelパニックを引き起こすかもしれないのでその前に止める

記事編集 編集
件名※必須
名前※必須
URL
任意のパスワード (投稿後のコメント修正・削除時に使用)
画像認証※必須 投稿キー(画像で表示されている数字を入力)
コメント※必須

※質問を投稿後に自己解決された場合は、原因と行った対処を具体的に書き込み下さるよう、よろしくお願いします。

- WEB PATIO -