Log AnalyticsのHeartbeatメトリックを使ったAzure VMの接続状況監視
Log Analyticsワークスペースと仮想マシン(Azure VM)接続状況を監視する手順纏めです。
Log AnalyticsワークスペースのHeartbeatのメトリックを使って監視します。
監視にはAzure Monitorを使っています。
-
- Heartbeatのメトリック使ったアラートルール作成
- アラート通知内容確認
Log Analyticsワークスペースとの接続状況はAzure Monitorのカスタムログ検索を使う方法とメトリックを使う方法があります。
今回はメトリックを使う手順を纏めています。
Heartbeatのログについてやカスタムログ検索での監視についてはこちらに纏めています。
※今回はAzure上の仮想マシンを対象に纏めています。
※Log AnalyticsはAzure Monitorログと名前が変わっています。Azure Portal上ではLog Analyticsワークスペースと表記されている為本記事ではLog Analyticsのままとしています。
Log AnalyticsワークスペースのHeartbeatメトリックを監視
Heartbeatのメトリックがある
Log AnalyticsワークスペースにはHeartbeatのメトリックがあります。
仮想マシン(Azure VM)はLog Analyticsワークスペースへ1分間に1度このメトリックを送信します。
このメトリックを利用する事でLog Analyticsワークスペースと仮想マシン(Azure VM)の接続状況を監視する事が出来ます。
アラートルール設定値
Heartbeatのメトリックを利用してAzure Monitorのアラートルールを作成します。
Heartbeatを5分間受信しなかった場合にアラートとします。
監視間隔は1分としています。
タブ名 | 項目名 | 設定値 |
スコープ | リソース | Log Analytics ワークスペース (log-test-01) |
条件 | シグナル名 | Heartbeat (プラットフォーム メトリック) |
アラート ロジック | しきい値:Static 集計の種類:合計 演算子:合計 単位:カウント しきい値:0 |
|
ディメンションで分割する | Computer (今後のすべての値を含める) |
|
評価するタイミング |
確認する間隔:5分 |
|
アクション | アクショングループ名 | ag-mail-01 (メール送信用) |
詳細 | 重大度(重要度) | 1 – エラー |
アラート ルール名 | Azure Monitor Agent HeartBeat Error(metric) | |
アラートを自動的に解決する | チェック |
※設定時は重大度と表示されますが、設定後は重要度と表示されます。
※監視間隔は要件に応じて変更します。今回は検証目的なので短めの設定としています。
Azure Monitorでアラートルール作成
アラートルールを作成します。
–広告—
仮想マシン(Azure VM)を起動停止してアラートを確認
仮想マシン(Azure VM)のtest-vm-01、02を起動停止してアラート。
アラートを発生させる
仮想マシン(Azure VM)を停止してアラートを発生させます。
-
- 実施した操作
- test-vm-01を停止
- test-vm-02を停止
- 実施した操作
受信したアラートメールを確認
受信したアラートメールの内容を確認します。
test-vm-01のエラーの場合です。
※アクショングループの共通アラート スキーマは無効にしています。有効にした場合にはアラートメールの表示内容が異なります。
アラートの回復を確認
仮想マシン(Azure VM)を起動してLog Analyticsワークスペースとの接続を回復させます。
-
- 実施した操作
- test-vm-01を起動
- test-vm-02を起動
- 実施した操作
アラートの条件をすべてとし解決済みのアラートも表示するようにします。
回復時のアクションの違いについて
カスタムログ検索で設定した場合とメトリックで設定した場合では障害発生中や回復時のアラート通知に違いがあります。
カスタムログ検索 | メトリック | |
発生時 | アラート通知される | アラート通知される |
継続中 | アラート通知がしばらく継続 (集計の粒度で指定した期間) |
アラート通知されない |
回復時 | アラート通知が停止 (アラートの条件は起動済み) |
回復の通知がされる (アラートの条件が解決済み) |
—広告—
最後に
Log AnalyticsワークスペースのHeartbeatメトリックを使って仮想マシン(Azure VM)の接続状況監視設定してみました。
アラート発生時や回復時にアラート通知出来ました。
仮想マシン(Azure VM)の死活監視としても適用できそうです。
引き続き色々試してみたいと思います。
Azure Monitor エージェントを利用してWindows ServerのイベントログをLog Analyticsワークスペース収集して監視する方法についてはこちらに纏めています。