
「Runbook」の作成は、安定した運用のためには欠かせない取り組みである一方、情報の最新性や正確性、スクリプトの使い方に関する課題も存在します。そこで注目されているのが、「Runbookの自動化」です。これは、Runbookに記載された手順を自動化することで、ヒューマンエラーを防止し、システム運用の効率化を図るための取り組みです。本稿では、Runbookの自動化について、その必要性やメリット、具体的な活用方法などを解説していきます。
Runbookにまつわる効率化の阻害要因とリスク
前回は、システム運用のためにRunbookを作成すること、そして作成するにあたってのステップを紹介しました。
とはいえ、Runbookを導入したからといって、ただちに運用が効率化するとは限りません。なぜなら、次のような課題が起きうるからです。
複雑な手順を毎回正確に実行する必要がある
運用において、ミスは許されません。実行するたびにミスがないよう、Runbookと見比べながら、時には指さし確認や同僚からのダブルチェックを受けながら行うことになるでしょう。これでは、なかなか効率はよくなりません。
すべてのシステムに担当者全員がアクセスできるわけではない
セキュリティリスクを軽減するため、適切なアクセス権限を行うことは重要です。その結果、運用担当者全員が必ずしもアクセス権限を持たない状況が発生してしまいます。そうすると権限を持った他の担当者を呼び出し、実行してもらう手間が生じます。
“運用ノウハウ”を伝えることが難しい
Runbookには記されない、“秘伝のタレ”のような運用ノウハウも存在します。こうした明文化されていないノウハウは、口伝やOJTで伝える必要があり、それには多くの時間を必要とします。
急激な業務環境の変化とシステムの複雑化
あらゆるものが素早く変化してしまう現代のビジネス環境にともない、システムもますます複雑化しています。今後もそのスピードは増していくばかりです。このスピード感の中で、会議や手書きのマニュアルを通してタイムリーかつ正確にノウハウを伝えることは、ますます難しくなるでしょう。
また、Runbookを手動で実行する際、次のようなさまざまなリスクがともないます。
操作ミス
手動でRunbookを実行する際、ステップの誤実行や順序の間違いが発生する可能性があります。どれだけ念入りにチェックしようとも、人間が行う限りミスはつきものです。これにより、意図しない結果やシステムの不整合が生じることがあります。
不十分な知識やスキル
Runbookの手動実行は、操作者の技術的な知識や経験に依存します。そのため、不適切な知識や経験不足が原因による、誤った操作が行われるリスクを抱えてしまいます。
文書化されていない変更
手動実行では、変更が適切に文書化されないことがあります。これにより、後のトラブルシューティングや監査が困難になる可能性もあります。
この記事は参考になりましたか?
- システム障害管理の効率化──AIOpsへの道筋連載記事一覧
-
- 導入急がれる「AIOps」成功のポイント──コストと時間をドブに捨てないために
- 「AIOps」で属人化したシステム障害管理は変わるのか、仕組みとユースケースからひも解く
- 「Runbook自動化」でシステム運用効率化を図るには、手動管理に潜むリスクを低減させる
- この記事の著者
-
草間一人(jacopen)(クサマカズト)
PagerDuty株式会社 Product Evangelist
通信事業者でプラットフォームエンジニアを務めたのを皮切りに、いくつかの外資系企業でプロフェッショナルサービスやプリセールスエンジニアとしてクラウドネイティブやプラットフォーム製品に携わるなど、10年以上さまざまな形でプラットフォームに関与し...※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
この記事は参考になりましたか?
この記事をシェア