WordPressの死活モニタリング

死活監視を導入する目的

  • サーバーダウンやハッキングによるサイト消滅を即座に検知し、ダウンタイムによる機会損失を最小化する
  • 管理者が常にサイトをブラウザで開いて確認する手間を省き、異常時のみ通知を受け取る体制を構築する
  • 負荷増大による一時的な応答遅延を把握し、サーバープランの見直しやキャッシュ導入の判断材料にする
  • 外部サービスによる客観的な監視を行うことで、サーバー内蔵の監視ツールでは気づけないネットワーク障害を検知する

外部サービスによる常時監視の仕組み

  • 5分〜15分おきに外部の監視サーバーからサイトへアクセス(HTTPリクエスト)を試行する
  • 応答コードが「200 OK」以外(500エラーや404エラー)を返した場合、異常として記録する
  • サイトの応答速度が一定の閾値を超えた場合に、パフォーマンス低下としてアラートを飛ばす
  • 接続失敗が一定回数以上連続したタイミングで、管理者へメールやプッシュ通知を送信する

監視対象の選定と通知設定

  • サイトのトップページだけでなく、ログイン画面や重要な問い合わせフォームのURLも監視対象に含める
  • サーバーメンテナンス時の誤報を防ぐため、特定の時間帯のアラートを一時停止する運用を検討する
  • 管理者一人だけでなく、緊急連絡先に指定したメンバーも通知を受け取れるようにグループ設定を行う
  • 通信のタイムアウト時間を適切に設定し、一時的なネットワークの揺らぎによる頻繁な誤報を抑制する

障害検知後の初動対応ルール

  • アラート受信時、まずは自分自身の端末からサイトが表示されるか、複数の回線(4G/Wi-Fi)で確認する
  • サーバー会社の障害情報を確認し、インフラ側の問題かWordPress内部の問題かを切り分ける
  • サイトが改ざんされている恐れがある場合は、即座にメンテナンスモードへ切り替えて被害拡大を防ぐ
  • 定期バックアップの最新データを確認し、必要に応じてリストア(復旧)の準備を開始する