WordPressの死活モニタリング
死活監視を導入する目的
- サーバーダウンやハッキングによるサイト消滅を即座に検知し、ダウンタイムによる機会損失を最小化する
- 管理者が常にサイトをブラウザで開いて確認する手間を省き、異常時のみ通知を受け取る体制を構築する
- 負荷増大による一時的な応答遅延を把握し、サーバープランの見直しやキャッシュ導入の判断材料にする
- 外部サービスによる客観的な監視を行うことで、サーバー内蔵の監視ツールでは気づけないネットワーク障害を検知する
外部サービスによる常時監視の仕組み
- 5分〜15分おきに外部の監視サーバーからサイトへアクセス(HTTPリクエスト)を試行する
- 応答コードが「200 OK」以外(500エラーや404エラー)を返した場合、異常として記録する
- サイトの応答速度が一定の閾値を超えた場合に、パフォーマンス低下としてアラートを飛ばす
- 接続失敗が一定回数以上連続したタイミングで、管理者へメールやプッシュ通知を送信する
監視対象の選定と通知設定
- サイトのトップページだけでなく、ログイン画面や重要な問い合わせフォームのURLも監視対象に含める
- サーバーメンテナンス時の誤報を防ぐため、特定の時間帯のアラートを一時停止する運用を検討する
- 管理者一人だけでなく、緊急連絡先に指定したメンバーも通知を受け取れるようにグループ設定を行う
- 通信のタイムアウト時間を適切に設定し、一時的なネットワークの揺らぎによる頻繁な誤報を抑制する
障害検知後の初動対応ルール
- アラート受信時、まずは自分自身の端末からサイトが表示されるか、複数の回線(4G/Wi-Fi)で確認する
- サーバー会社の障害情報を確認し、インフラ側の問題かWordPress内部の問題かを切り分ける
- サイトが改ざんされている恐れがある場合は、即座にメンテナンスモードへ切り替えて被害拡大を防ぐ
- 定期バックアップの最新データを確認し、必要に応じてリストア(復旧)の準備を開始する