著者が実践する3つの重要な役割
最後に、ITサービス運用を主管するベンダー企業がSREを効果的に活用する上で、筆者が実践している重要な3つの役割を説明します。
まず1つ目は、カスタマー・リライアビリティ・エンジニア(CRE)です。CREは、SREと同様にGoogleが提唱したロールであり、顧客の信頼性向上にフォーカスしたエンジニアリング知識と顧客対応のスキルを併せ持ちます。システムの安定稼働に対する顧客の不安や改善要望、クラウドネイティブな環境に対する移行支援や運用などの新たな価値を提案し、ITシステムのあるべき姿をともに構築します。
2つ目は、SREです。顧客が提供するITシステムの信頼性を向上させるシステム運用の改善を担当し、SLI・SLOの改善によるサービスレベルの向上やToilと呼ばれる繰り返し行われる自動化可能な手動対応の削減、インシデント対応の効率化やポストモーテムを行う上での非難しない文化の醸成を優先度に実施します。
最後に3つ目は、プラットフォーム・エンジニア(PE)です。PEはDevOpsの原則に基づき、システム開発プロセスの効率化を目指してプラットフォームを提供する役割であり、CI/CDパイプラインやオブザーバビリティ基盤の整備を行います。なお、正確に表現するとSREとは目的や業務範囲が異なりますが、本稿ではSREメソドロジーの枠組みにPEも含めて説明しています。顧客に対する信頼性向上、システム運用の自律的な改善、システム開発の効率化を担うこれらの役割が相互に連携することで、ユーザーの満足度を最大化します。

本稿では、エンタープライズ企業が全体最適化を実現するために、ITサービス運用の現場で求められるアプローチを詳述しました。運用体制のブラックボックス化を打破しようと内製化の取り組みを進めている企業もありますが、IT人材不足という重大な課題に直面しています。
そこで、運用の高度化を図るアプローチとして、オブザーバビリティを活用したシステム状態の可視化と意思決定の指針の明確化、そしてSREメソドロジーの導入によるシステム信頼性の向上と継続的な改善活動の実現について述べました。本稿が、多くのエンタープライズ企業にとってユーザー満足度を最大化しながらもビジネスのアジリティを高める、持続可能なITサービス運用の共創を目指す一助となることを期待しています。