(その5)USBでウォッチ・ドッグする
サーバにつきものなのが突然の故障。本番稼働中はネットワーク経由の監視が一般的ですが、調子の悪い機体や検査中はかえってメンドウ。
ワタシ故障しました!と表示されたらラクですね、そんなわけでUSBウォッチ・ドッグを作ってみました。
ウォッチ・ドッグは古典的な手法ながらも、コンピュータやMCUには欠かせない存在。
「番犬」の名から監視装置に思われがちですが、じつは単なるタイマーで、制限時間になるまでひたすらカウント、オーバーしたら障害発生と判断します。
そのためシステムはときどきリセット信号を発生し、タイマーをゼロに戻しています。
制限時間を超えると再起動やメモリダンプをおこなってくれますが、電源をはじめ深刻な障害が起きるとウォッチ・ドッグも停止…
突然フリーズした!なんてときは、残念ながら期待できません。マザーボードに同居している以上しかたのない話ですね。
そこでMCUでHIDを作り、外付けのUSBウォッチ・ドッグを作成、およそ1秒に1回「割り込み」を発生させ、応答があれば正常、なければエラーと判断します。
HIDはマウスやゲームパッドなどの総称で、ほとんどのOSで標準サポートされているためドライバ不要。挿すだけで使えるのが魅力です。
割り込み、と言っても負荷はごくわずか。
マウスでも0.01秒単位でおこなえるようになっているぐらいですから、毎秒1回程度でシステムに負担をかけることはないでしょう。
エラー時は、
・連続エラー
・累積エラー
の2つを加算し、連続60回(=約1分間)応答がなければ発報する仕組み。
また、60秒未満でもエラーが多発するようなら故障の前触れやスペック不足が考えられるので、累積エラーにもリミットをつけておきました。
また、フリーズや再起動によって「単に通電されているだけ」状態になったら即・発報! なサドンデス条件も付けくわえ、ブザーも鳴るようにしました。
直径1cm足らずのブザーですが、救急車のサイレンに匹敵する83db(デシベル)と、頼もしくもやかましい一品です。
サーバを傷つけないようシリコンカバー付きのケースをチョイス、およそ8cm×4cmにムリヤリ押し込みます。
使い方はカンタン、USBポートに接続し赤いスタートボタンを押すだけ。お子様でも安心してご利用いただけます。
百聞は一見にしかず。刮目Pleaseプリーズ!
ACアダプタやバッテリーでセルフパワーにすれば、シャットダウンにも対応できます。とりあえず自宅サーバにつないで様子見することにしましょう。
HIDいとをかし度:★★★★☆
夜中の83db大迷惑度:★★★★★
カテゴリー
タグ
- #ストレージ(ソフト)
- #VMware
- #Veeam Backup & Replication
- #AIインフラ
- #AMD EPYC
- #スケールアウトNAS
- #NVIDIA H200
- #NIC
- #LLM
- #AI
- #エンタープライズ
- #NVIDIA
- #NVMe
- #画像生成AI
- #コア
- #スケールアップ
- #NVIDIA A800
- #Ethernet
- #水冷サーバー
- #CPU
- #GPU
- #グリーンコンピューティング
- #SSD
- #NVIDIA H100
- #スレッド
- #スケールアウト
- #NVIDIA L40
- #Network
- #NVIDIA RTX 6000 Ada
- #Supermicro
- #GPUサーバー
- #グリーンIT
- #SAS SSD
- #ソフトウェア・デファインド・ストレージ
- #クロック周波数
- #Qumulo
- #SXM
- #InfiniBand
- #NVIDIA RTX A6000
- #Intel
- #マイグレーション
- #空冷
- #SATA SSD
- #Seagate
- #ECCメモリ
- #RedHat
- #PCle
- #NVIDIA MIG
- #量子コンピューター
- #AMD
- #レガシーアプリ
- #水冷
- #NVMe SSD
- #OSNEXUS
- #PCIレーン数
- #人工知能
- #SDS
- #DNN
- #QPU
- #サーバー
- #Windowsアップデート
- #Numecent
- #バックアップ
- #シーゲイト
- #L2 Cache
- #ChatGPT
- #水冷技術
- #NVIDIA Hopper アーキテクチャ
- #NVIDIA B200
- #朝日新聞
- #AVD
- #Azure Virtual Desktop
- #エンタープライズバックアップソリューション
- #EXOS AP
- #ストレージグリッド
- #コンテナ化
- #L4
- #NVLink
- #ProphetStor
- #ICXセンター
- #クラウドVDI
- #DX
- #Veritas NetBackup/BackupExec
- #EXOS CORVAULT
- #セキュリティ
- #OS
- #NVIDIA L4
- #NVSwitch
- #Windows10サポート終了
- #Windows10リプレース
- #アプリケーション
- #Acronis Backup
- #QuantaStor
- #SaaS
- #Docker
- #冷却機能
- #GPUアーキテクチャ
- #Windows Update
- #マイクロソフト
- #ランサムウェア
- #IBM Spectrum Protect
- #VMware
- #PaaS
- #Kubernetes
- #アプリケーション仮想化
- #vGPU
- #Cloudpaging
- #Intel筐体
- #サイバー攻撃
- #ArcServe
- #vSAN
- #仮想化
- #ITインフラ
- #アプリ仮想化
- #データセンター
- #ソフトウエア・ディファインド・ストレージ
- #AMD筐体
- #情報セキュリティ
- #NAS
- #HCI
- #IaaS
- #NVIDIA A100
- #Citrix
- #オンプレミス
- #ストレージ
- #VMware Explore
- #マルウェア
- #Network Attached Storage
- #Hyperconverged Infrastructure
- #パブリッククラウド
- #レガシーアプリケーション
- #ThinApp
- #エッジコンピューティング
- #ソフトウェア
- #NVIDIA AI Enterprise
- #ExaGrid
- #AI Enterprise
- #仮想化ストレージソリューション
- #ハイブリッドクラウド
- #NVIDIA L40S
- #App-V
- #ニューラルネットワーク
- #ストレージ(ハード)
- #VMware Tanzu
- #Veeam
- #NVAIE
- #Intel Xeon
- #マルチクラウド
- #NVIDIA A40
- #Microsoft Application Virtualization
- #ディープラーニング
アーカイブ
- 2024年12月 (3)
- 2024年11月 (10)
- 2024年10月 (15)
- 2024年9月 (10)
- 2024年8月 (10)
- 2024年7月 (10)
- 2024年6月 (11)
- 2024年5月 (10)
- 2024年4月 (10)
- 2024年3月 (8)
- 2024年2月 (9)
- 2024年1月 (8)
- 2023年12月 (11)
- 2023年11月 (8)
- 2023年10月 (14)
- 2023年9月 (9)
- 2023年8月 (8)
- 2023年7月 (11)
- 2023年6月 (3)
- 2023年5月 (1)
- 2023年4月 (6)
- 2023年3月 (1)
- 2023年2月 (6)
- 2023年1月 (1)
- 2022年12月 (4)
- 2022年11月 (4)
- 2022年10月 (4)
- 2022年9月 (3)
- 2022年8月 (4)
- 2022年6月 (5)
- 2022年5月 (3)
- 2022年4月 (1)
- 2022年3月 (4)
- 2022年1月 (1)
- 2021年11月 (3)
- 2021年10月 (2)