基本情報
タイトル | インシデントにわかりやすいタイトルをつける |
---|---|
インシデント発生日時 | インシデントが発生した日時(可能なら分まで記入) |
インシデント検知日時 | インシデントを検知した日時(可能なら分まで記入) |
インシデント復旧日時 | インシデントの暫定復旧が完了した日時(可能なら分まで記入) |
ポストモーテム作成日 | |
バグレベル | |
インシデントチケット | チケットのリンク |
著者 | |
共著者 | |
レビュアー | |
現在のステータス | 対応中/レビュー待ち/完了 etc… |
本番影響の有無 | 有/無 |
インパクト | ユーザー何人に影響した、収益への影響など。集計の詳細やエビデンスへのリンクも記載する。 |
完了チェック
※全て埋まったらセクションごと消す
- 復旧対応は完了したか
- すべての項目を記載したか
- レビューは完了したか
- チームで振り返り(レビュー会)を行ったか
- 必要なアクションアイテムの起票が終わったか
- 関係者へ展開したか
3行でまとめると?
- 何がおきたのか、影響は?
- 原因は?
- 教訓を一言で
発生要因
今回何がトリガーになってインシデントが発生したのかを記載する。
検知
どのようにインシデントを検知したのかを記載する。監視ツール、ユーザー問い合わせ etc…
根本原因
インシデントを引き起こした原因をすべて記載する。対応中のミスで悪化させてしまった場合などもちゃんと書く。
解決
どのようにインシデントを解決したのかを記載する。暫定対応と恒久対応がある場合は明示的に分けて書く。恒久対応が残っているならアクションアイテムにチケットを貼る。
影響
影響範囲・内容についての調査や深掘り。分量が少なく冒頭の表「インパクト」で十分な場合は、その旨を記載のうえ省略OK。
アクションアイテム
対応内容 | 担当者 | 種別 |
---|---|---|
チケット化したものはリンクを貼る | ||
種別について
リカバリ対応
インシデントを収束させるために行う対応(暫定的・根本的どちらも含む)再発防止
再発防止のために行う対応再発時影響緩和
次回再発した際に影響を最小限にするための対応(ドキュメント整備や障害訓練など)その他
その他
振り返り
うまくいったこと
ex. 監視ツールの通知が適切に動き検知が迅速だった。エスカレーション対応が適切だった。etc…
うまくいかなかったこと
ex. 障害対応ドキュメントに不備があり対応が遅れた。etc…
幸運だったこと
ex. もっと大規模なインシデントに発展する可能性があったが、hogeのデフォルト設定がfooになっていたため最小限の影響で済んだ。etc…
レビュー会議事録
レビュー会でのフィードバックを記録する。
タイムライン
日時(JST) | 内容 | 対応者、関係者 |
---|---|---|
mm/dd hh:mm | 適宜Slackなどのリンクを貼る | |
参考情報
参考にした資料や記事など。