watchdog timer softdog

wikipediaより

ウォッチドッグタイマー (watchdog timer) は、
コンピュータのハードウェア時間計測器である。
メインのプログラムがハングアップなどの不正な状態に陥ってしまい
規則的なウォッチドッグ操作
(「犬をなでる」とも呼ばれる「サービスパルス」の書き込み)
が行なわれなかった(タイムアウト)場合に、例外処理が実行される。
例外処理は、ハングアップしたシステムを正常動作に戻すことを目的として
システムをリセットする場合が多いが、
電源切断によりシステムを強制停止させるものや電源を切断した後に
再投入するものもある。

http://www.usupi.org/sysad/198.htmlより..

Linuxカーネルには、watchdog timerをソフト的に実現したドライバがあり、
その名を"softdog"だそうです。

1) #modprobe softdog
2) #lsmod | grep softdog
3) #ls -l /dev/watchdog

これで準備完了。
この状態ではまだwatchdog timerは動作(起動?)していない。
4) echo > /dev/watchdog ( "V" 以外の文字でも同じ効果)

どのようなオプションでsoftdogが起動しているかは、dmesg(または
/var/log/messagesでもok?)で確認できる。

栗日記さんのところからコピペ

#!/bin/sh
WDT_TIMEOUT=120
SLEEP_TIME=30
[ -z "`grep watchdog /proc/misc`" ] && modprobe softdog soft_margin=$WDT_TIMEOUT
[ -c /dev/watchdog ] || exit 1
echo > /dev/watchdog
sleep $SLEEP_TIME

test -z strings .. stringsの長さが0の場合真
test -c /dev/xxx .. char devだったら真

これをcronで毎分毎に起動すればwatchdog(softdog)の出来上がりってわけですな

何かをまちがえると、いきなりリブートって訳ねw

出典は栗日記、"いますぐ実践! Linuxシステム管理"から