Monitoring > System Monitoringサービスでは、Instanceでユーザーが作成したインスタンスに対するモニタリング機能を提供します。 インスタンスのシステムリソース状態をチャート形式で視覚化して表示でき、使用量のしきい値を設定して、特定状態の通知をメールまたはSMSで受信できます。
System Monitoringは、各インスタンスにインストールされたSystem Monitoring Agentでシステム指標を収集します。 基本的にAgentはインスタンスのイメージに含まれているため、インスタンス起動時に自動的に収集を始めます。 しかし、System Monitoringサービスがリリースされた2019年7月23日より前に作成され動作しているインスタンスの場合は、別途Agentをインストールする必要があります。 Agentのインストール方法は、Monitoring > System Monitoring > コンソールガイド > Agentインストール方法を参照してください。
Compute > Instanceで作成したインスタンスの各種システム指標をチャートで提供し、各インスタンスの状態を把握できます。チャートを任意のレイアウトで配置したり、レイアウトを複数作成したり、目的に応じて管理できます。
データは1分単位で収集され、最大5年間保管されます。収集されたデータは5分、30分、2時間、1日単位で集計されます。集計単位別の保管期間は下記の通りです。
集計単位 | 保管期間 |
---|---|
1分 | 7日 |
5分 | 1ヶ月 |
30分 | 6ヶ月 |
2時間 | 2年 |
1日 | 5年 |
収集されたシステム指標のしきい値を設定し、インスタンスを常に監視し、異常な兆候を把握できます。 例えば、CPU使用率が90%を超える場合、特定NICの使用量が1000ppsを超えた場合、特定プロセスが中断した場合など、インスタンスの状態を把握するためのさまざまな監視が可能です。
設定した監視条件を満たす状況が発生した時、どの方法で通知を受信するかを選択できます。 メールやSMSで通知を受信できます。
用語 | 説明 |
---|---|
システム指標 | System Monitoringでは収集する各インスタンスからリソース値を取得します。CPU使用率、ロードアベレージ(load average) 1m、メモリ使用量などがあります。 |
レイアウト | チャート化されたデータをどう配置するかを設定します。ユーザーは自由にチャートを配置でき、複数のレイアウトを作成して、目的に応じて管理できます。 |
ユーザーグループ | イベントが発生した時、通知を受信するユーザーリストです。 |
通知グループ | しきい値を設定し、どのインスタンスを監視するか、イベント発生時にどのユーザーグループに通知を送るかを指定します。 |
監視設定 | 各システム指標のしきい値を設定する箇所です。 |