監視ツール高度化で「アラートノイズ」が頭痛のタネに シニアエンジニアへの負荷も増大、どう解消する?
担当者を悩ませる「インシデント対応」における課題
近年、ITシステムの複雑化により、インシデントの発生件数も増加傾向にあります。ひとたびインシデントが発生するとサービスの提供が停止し、ビジネスに大きな影響を与えます。そのため迅速な対応が求められるのですが、そこには多くの課題があります。ITシステムはさまざまなサービスやアプリケーション、インフラストラクチャから構成されており、それらが相互に連携して動作しています。障害が発生した際、どの部分に問題があるのかを特定することは容易ではありません。時には、複数の部分に問題がある場合もあり、原因の特定には高度な知識と経験が必要とされます。本稿では、担当者を悩ませるインシデント対応における課題と、それらの解決策について解説します。
この記事は参考になりましたか?
- システム障害管理の効率化──AIOpsへの道筋連載記事一覧
- この記事の著者
-
草間一人(jacopen)(クサマカズト)
PagerDuty株式会社 Product Evangelist
通信事業者でプラットフォームエンジニアを務めたのを皮切りに、いくつかの外資系企業でプロフェッショナルサービスやプリセールスエンジニアとしてクラウドネイティブやプラットフォーム製品に携わるなど、10年以上さまざまな形でプラットフォームに関与し...※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
この記事は参考になりましたか?
この記事をシェア