オブザーバビリティによる可視化は単なる監視の延長ではない
ビジネス価値の創出を目指して既存のIT運用サービスを見直すには、単にクラウド・ネイティブの技術を活用してレガシーなITシステムをクラウドに移行するだけではなく、運用組織の体制変更や役割の再定義といった運用トランスフォーメーションも求められます。ユーザー企業の業務プロセスに応じた運用組織を編成し、それぞれの業務プロセスを担当するチームがシステム全体の可観測性を向上させるオブザーバビリティ・プラットフォームを効果的に活用することこそ、共創型のITサービス運用を実現する上で重要となります。
オブザーバビリティは、システムを外部から観察する、すなわちシステムの内部状態を可視化することで、発生した事象の結果だけでなく原因に対しても深掘りする仕組みを提供します。メトリクス・トレース・ログの3つに代表されるテレメトリーデータに基づき、システム状態に異常が発生した際に迅速に障害原因を特定することが可能です。一例として、オブザーバビリティはレスポンス遅延という新たな脅威に対応するためにユーザー目線の監視・管理を実現します。
加えて、オブザーバビリティを単なる監視の延長として捉えるのではなく、テレメトリーデータを効果的に活用して組織がどのような情報を意思決定の指針としているのかを示すこともできます。運用組織が目指す具体的な数値を可視化し、目標値に対する現在地を常に把握する、運用の鏡となる指標であることも重要な価値となります。
では、具体的にどのようにオブザーバビリティを活用して共創型のITサービス運用を実現するのでしょうか。その鍵となるのは、SREのメソドロジーに基づいた高度なITスキルです。
SREとは、Googleで発展したシステム管理とサービス運用の方法論で、ユーザー満足度を最大化させるためにソフトウェアエンジニアリングの技術を活用してシステムの信頼性を確保することを目的としています。2024年に発行されたO'Reilly Japanの『SREをはじめよう ―個人と組織による信頼性獲得への第一歩』では、「組織がシステム、サービス、製品において適切なレベルの信頼性を持続的に達成できるように支援する工学分野」として紹介されており、迅速かつ反復的なシステム開発と高可用性を担保したシステム運用を両立し、持続可能な開発・運用サイクルを目指します。
ここで強調したいのは、SREのメソドロジーを活用することは、単なるインフラエンジニアが付加価値として自動化を推進することに留まらないという点です。もちろん、自動化はソフトウェアエンジニアリングの技術を活用するSREにとって不可欠なスキルとなりますが、本質はユーザーの満足度を最大化しながらもビジネスのアジリティを高めるというトレードオフの関係に重点を置いて運用を効率化することにあります。
SREが目指すITサービス運用では、オブザーバビリティを基盤にサービスレベルの向上と継続的な改善活動が必要不可欠です。信頼性を数値として可視化した指標のSLI(Service Level Indicator)、そして目標値となるSLO(Service Level Objective)を定義し、データに基づいて迅速性と可用性のバランスを重視した意思決定を行います。また、組織内で蓄積されたスキルセット・ノウハウを共有し合い、取り扱うサービスが同一の開発チームと運用チームの境界線を曖昧にすることで、ITサービス開発・運用の双方が利益を享受する持続可能な価値提供を実現します。

[クリックすると拡大します]