genkai-shobo.jp

システム障害対応の教科書


著者:木村誠明/著
価格:2,680円+税
刊行日:2020/03

出版社:技術評論社
ISBN:978-4-297-11265-3
Cコード:3055
[単行本](電子通信)


内容紹介

ITサービスにシステム障害はつきものです。システム障害発生時に適切な対応ができるかどうかでユーザへの影響は大きく変わり、うまくできずに被害を拡大させてしまった事例も多くあります。これは、システム障害対策の現場で必要なノウハウ(基本動作、ツール、必要ドキュメントなど)が体系化されておらず、暗黙知になっていることが一因です。本書は、これまで暗黙知だったシステム障害対応を体系的にまとめて形式知とすることで、個人・組織のシステム障害対応力を向上させることを目的とした解説書です。障害対応を指揮する「インシデントコマンダー」や、実際に作業にあたる作業者が知っておくべき知識を解説するとともに、高い障害対応力を備えた組織作りや教育の仕組みについても紹介します。

もくじ

第1章◆システム障害対応を学ぶ意義
1.1 なぜシステム障害対応は暗黙知だったのか
1.2 上昇し続けるシステム障害対応の難易度
1.3 システム障害対応時に起こり得るさまざまな問題
第2章◆システム障害の定義
2.1 システム障害とは何か
2.2 システム障害対応の目的と定義
第3章◆システム障害対応の登場人物と役割
3.1 システム障害対応の登場人物の概要と体制
3.2 インシデントコマンダーの役割と基本動作
3.3 作業担当
3.4 ユーザ担当
3.5 CIO
第4章◆各プロセスの基本動作~発生から終息まで
4.1 検知・事象の確認
4.2 業務影響調査
4.3 原因調査
4.4 復旧対応
4.5 イベントの確認/事後対応
第5章◆障害対応に必要なドキュメント
5.1 障害対応フロー図
5.2 オンコールシフト表と連絡先管理表
5.3 障害レベル管理表
5.4 障害状況ボード
5.5 作業タイムチャートシフト表
第6章◆システム障害対応力を高めるツールと環境
6.1 大規模システム障害のコントロール
6.2 システム監視ダッシュボード
6.3 War Roomダッシュボード
6.4 War Room
6.5 構成管理データベース(CMDB)
第7章◆組織の障害対応レベル向上と体制作り
7.1 障害対応レベルの維持・向上
7.2 障害対応を担う組織や体制
第8章◆システム障害対応力の改善と教育
8.1 組織の障害対応力の継続的な改善
8.2 教育と訓練
Appendix◆難易度の高いシステム障害ケース
ケース1 ビジネスロジックアプリケーション障害と「誤データの波及」
ケース2 インフラ障害における機器の「半死」
ケース3 大規模インフラ障害と「伝言ゲーム」
ケース4 キャパシティ障害
ケース5 災害時のコントロール~3.11のふりかえり

木村誠明

株式会社野村総合研究所 上級システムコンサルタント。金融系業務システムの開発・保守運用に携わり多くの障害対応を経験。その後、システム運用高度化のための技術開発・サービス開発を実施。現在はITサービスマネジメントの専門家として、社内外のシステム運用の改善に携わるとともに、障害対応力向上のための研修講師も手掛ける。NRI認定ITサービスマネージャー。