【インフラデザイン】インフラ初心者の机上学習 〜 2.1 可用性対策の基本

今回は、可用性対策の基本を取り上げる。
可用性とは何か、可用性要件とは何か、可用性対策とは何か、可用性を脅かす要因は何かといったことについて触れる。

可用性の定義は次の通り(wikipediaから引用)。

可用性(かようせい、英: Availability; アベイラビリティ)とはシステムが継続して稼動できる能力のこと。
可用性に信頼性・保守性を含めたRAS、更に保全性・安全性を含めたRASISについても説明する。

また、信頼性とは次の通り(wikipediaから引用)

アイテムが与えられた条件で規定の期間中、要求された機能を果たすことができる性質。
信頼性を計る指標や関連する性質として次のものが挙げられる。
・故障率 (Failure Rate)
平均故障間隔 (Mean Time between Failures) および 平均寿命 (Mean Time to Failures)
・平均修復時間 (Mean Time to Repair)
・可用性、稼働率 (Availability)
・耐用寿命 (Length of Operating Period)

さて、可用性・信頼性といった言葉はこのように定義されるわけだが、それでは、可用性・信頼性を保証するためには、どうすればよいのか。その全体像を確認する。

基本的な流れは、システム稼働前に故障の防止策・復旧作業計画を綿密に練り障害復旧時にはその計画に従って対応しつつ、計画は都度見なおして改善していくことである。

なぜこのように様々な計画を立てなければならないかは、原因が広範囲に渡ることによる。
IT proの記事「トラブル原因の半分が「うっかり」 (2/3)」に紹介されている。

これらの原因それぞれに対して、対策を考える。さらに、費用対効果も考慮して対策を施すかどうか、対策を施すタイミングを決定する。