/postmortem-templates-jp

ポストモーテムの日本語テンプレート

基本情報

タイトル インシデントにわかりやすいタイトルをつける
インシデント発生日時 インシデントが発生した日時(可能なら分まで記入)
インシデント検知日時 インシデントを検知した日時(可能なら分まで記入)
インシデント復旧日時 インシデントの暫定復旧が完了した日時(可能なら分まで記入)
ポストモーテム作成日
バグレベル
インシデントチケット チケットのリンク
著者
共著者
レビュアー
現在のステータス 対応中/レビュー待ち/完了 etc…
本番影響の有無 有/無
インパクト ユーザー何人に影響した、収益への影響など。集計の詳細やエビデンスへのリンクも記載する。

完了チェック

※全て埋まったらセクションごと消す

  • 復旧対応は完了したか
  • すべての項目を記載したか
  • レビューは完了したか
  • チームで振り返り(レビュー会)を行ったか
  • 必要なアクションアイテムの起票が終わったか
  • 関係者へ展開したか

3行でまとめると?

  • 何がおきたのか、影響は?
  • 原因は?
  • 教訓を一言で

発生要因

今回何がトリガーになってインシデントが発生したのかを記載する。

検知

どのようにインシデントを検知したのかを記載する。監視ツール、ユーザー問い合わせ etc…

根本原因

インシデントを引き起こした原因をすべて記載する。対応中のミスで悪化させてしまった場合などもちゃんと書く。

解決

どのようにインシデントを解決したのかを記載する。暫定対応と恒久対応がある場合は明示的に分けて書く。恒久対応が残っているならアクションアイテムにチケットを貼る。

影響

影響範囲・内容についての調査や深掘り。分量が少なく冒頭の表「インパクト」で十分な場合は、その旨を記載のうえ省略OK。

アクションアイテム

対応内容 担当者 種別
チケット化したものはリンクを貼る
種別について
  • リカバリ対応 インシデントを収束させるために行う対応(暫定的・根本的どちらも含む)
  • 再発防止 再発防止のために行う対応
  • 再発時影響緩和 次回再発した際に影響を最小限にするための対応(ドキュメント整備や障害訓練など)
  • その他 その他

振り返り

うまくいったこと

ex. 監視ツールの通知が適切に動き検知が迅速だった。エスカレーション対応が適切だった。etc…

うまくいかなかったこと

ex. 障害対応ドキュメントに不備があり対応が遅れた。etc…

幸運だったこと

ex. もっと大規模なインシデントに発展する可能性があったが、hogeのデフォルト設定がfooになっていたため最小限の影響で済んだ。etc…

レビュー会議事録

レビュー会でのフィードバックを記録する。

タイムライン

日時(JST) 内容 対応者、関係者
mm/dd hh:mm 適宜Slackなどのリンクを貼る

参考情報

参考にした資料や記事など。