Azure リソース正常性(Resource Health)の監視設定

2020-07-18Azure,Monitor

Azure Monitorを利用したリソース正常性(Azure Resource Health)の監視とアラート通知の設定手順です。

リソース正常性を利用することで、自分のAzureリソースが使用可能な状態にあるかどうかを確認できます。
サービス正常性(Azure Service Health)はサービス全体の影響を確認するものです。
サービス正常性に異常がなくても、自身のリソースに影響を受けている可能性があります。

リソース正常性はAzure基盤の障害だけでなく、ユーザー自身が行った操作による影響も確認できます。
たとえば、ユーザー自身が行った仮想マシン(Azure VM)の停止もリソース正常性の一つとして通知できます。

今仮想マシンに対するリソース正常性の監視とアラート通知設定までの手順を確認しています。
送信された、アラートメールも確認しています。

サービス正常性の監視設定については、こちらで紹介しています。

※本記事では、Azure Virtual Machines(Azure VM)を仮想マシンとして表記しています。
※本記事では、Azure Resource Healthをリソース正常性として表記しています。
※本記事では、Azure Service Healthをサービス正常性として表記しています。

スポンサーリンク

リソース正常性をAzure Portalで確認

リソース正常性とは

リソース正常性は、Azure Service Healthに含まれるサービスの一つです。
自分のAzureリソースの正常性状態を確認できます。

ざっくり言えば、サービス正常性はリージョンに発生した影響を示し、リソース正常性は個々のリソースの正常性を表します。

サービス正常性とリソース正常性違いや、リソース正常性確認方法についてはこちらで紹介しています。

Azure Portalでリソース正常性を確認

Azure Portalでのリソース正常性(Resource Health)の確認例です。
リソース正常性は、Azure MonitorのService Health内のリソース正常性や、各Azureリソースのリソース正常性のメニューで確認できます。

リソース正常性確認

モニターのService Healthにリソース正常性を選択します。
リソースの種類を選択して、リソース正常性を一覧表示できます。

※画面サンプルは仮想マシンを選択した場合です。

Azureリソースのメニューでもリソース正常性を確認できます。
リソース正常性の履歴を確認できます。

何かあった場合は、リソース正常性のマークをクリックします。詳細を確認できます。

※画面サンプルはユーザーが仮想マシンを停止した際に発生した通知です。

Azure Monitorでリソース正常性の監視設定

Azure Monitorを使ってリソース正常性の監視を設定します。

リソース正常性のアラートルールを追加

モニターのService Healthから設定します。

リソース正常性アラートを追加
モニターのService Healthを選択します。
リソース正常性を選択します。
リソース正常性アラートの追加を選択します。

リソース正常性アラートのスコープを設定

スコープでリソース正常性の対象を選択します。
リソースグループ、リソースの種類、リソースを選択できます。
将来作成するリソースを自動的にスコープに追加することもできます。

リソース正常性のスコープを設定

スコープでは以下の内容を選択します。

    • サブスクリプション
    • リソースグループ
    • リソースの種類
    • リソース

すべてを選択した場合は、今後作成するリソースを含めるかどうかを選択できます。

リソース正常性の変化条件を設定

条件設定です。
条件の設定では、リソース正常性の変化条件を指定します。

    • イベントの状態:発生したのか、解決しているのかと言った状態
    • 現在のリソースの状態:対象リソースの状態遷移後(現在)の状況
    • 以前のリソースの状態:対象リソースの状態遷移前の状況
    • 理由の種類:ユーザー起因なのか、サービス側の影響なのかと言った発生原因
条件の設定
イベントの状態、現在のリソース状態、以前のリソース状態、理由の種類の4項目を組合せて検出したいリソース状態変化を設定します。  

イベントの状態は4つになります。
発生と解消のタイミングで受信したいのでActiveとResolvedを選択します。

  • Active(発生)
  • In Progress(進行中)
  • Resolved(解決)
  • Updated(更新)

In Progress(進行中)やUpdated(更新)は発生中に随時される内容で、リソース状態の変化ではない為基本的には設定しません。

発報のトリガー / リソースの状態 (“condition”)

現在のリソースの状態は3種類です。
異常に変化した場合を把握したいので、DegradedとUnavailableを選択します。

  • Available(使用可能)
  • Degraded(パフォーマンス低下(リソースは使用可能))
  • Unavailable(使用不可)

※仮想マシンの場合はDegradedはないそうです。

以前のリソースの状態は4種類です。
元々正常だった状態からの変化を把握したいのでAvailableを選択します。

  • Available(使用可能)
  • Degraded(パフォーマンス低下(リソースは使用可能))
  • Unavailable(使用不可)
  • Unknown(不明)

※Unknown(不明)はリソース状態がAzure基盤側で取得出来ない場合に発生します。リソースが正常に動作している場合でも発生する可能性があります。選択しておいた方が無難です。

理由の種類です。
今回はすべて選択します。
ユーザー自身が操作して発生させた場合はUser Initiatedとなります。

Platform Initiated:プラットフォーム(Azure基盤側)起因
Unknown:不明な場合
User Initiated:ユーザー操作起因

※Azure基盤側の障害による影響のみを把握したい場合は、Platform Initiatedを選択します。

※回復時を把握したい場合はリソースの状態を現在と以前の設定値を逆にします。

アクショングループやアラートルール名を設定

Azure Monitorのアクショングループやアラートルール名を設定します。
“リソース正常性アラートが発生しました"というタイトルでメールを送信します。

アクショングループ、アラートルール名を設定
アクショングループを選択します。
事前に準備しておいたメール送信用のアクショングループを選択しています。
アクショングループが設定されているか確認します。

アラートルール名やアラートルールの保存先を指定します。
アラートルール名はメールタイトルや本文に表示されます。

アラートルール名は"リソース正常性アラートが発生しました。"としています。

—広告—

仮想マシンを停止してリソース正常性のアラートメールを確認

稼働中の仮想マシンを停止してアラートを発生させます。

リソース正常性のアラートメール

仮想マシンを停止してしばらくすると、リソース正常性のアラートメールを受信します。

リソース正常性のアラートメール

Important notice: Azure Monitor alert リソース正常性アラートが発生しました。 was activatedとメールタイトルでアラートを受信しました。

本文を見るとカテゴリーにResourceHealthとあり、リソース正常性のアラートだと分かります。

Resource IDにアラート発生したリソースIDが表示されます。

状態遷移内容はPropertiesに表示されます。仮想マシンを停止しているので、Stopping and deallocatingとなっています。現在のリソース状態はUnavailable、以前のリソース状態はAvailableとなっている事も分かります。

※今回はユーザー操作で発生させているので"csuse":"UserInitiated"となります。

※アラート通知はリソースID単位になります。

プラットフォームから出力される仮想マシンのリソース正常性理由

プラットフォーム(Azure基盤)の影響でリソース正常性に影響があった場合の理由については、こちらに記載されています。

Resource Health 仮想マシンの正常性に関する注釈

最後に

リソース正常性のアラート通知設定手順について確認しました。
非常に簡単に設定でき、プラットフォーム(Azure基盤)の障害によるリソースへの影響を把握できます。

引き続き、いろいろ試してみたいと思います。

Logic Apps(ロジックアプリ)を使ってリソース正常性の状態をメール送信する方法については、こちらで紹介しています。

スポンサーリンク