みんなの銀行に備わる文化と価値観、「システム障害は必ず発生する」
ふくおかフィナンシャルグループ(FFG)傘下のデジタル専業銀行である「みんなの銀行」。2019年に準備会社を設立し、2021年1月、システムの本格稼働とともに開業した。現在は金融機能やサービスを、APIなどを通じて提供するBaaS(Banking as a Service)事業も展開している。
同行におけるサービス開発の多くは、同じくFFG傘下のゼロバンク・デザインファクトリーに所属するエンジニアが担当している。そして宮本氏は、両社のCIOを兼任し、組織全体のITシステムを統括する。
金融の分野はミッションクリティカルな性質上、システム障害対策にもより一層注力しなければいけない。宮本氏は、「障害は“必ず発生するもの”だと考えています。開業以前から、障害が発生した際にはシステム担当者など特定の個人に責任を問うのではなく、銀行員からエンジニアまでが全員でリカバリーする文化を醸成することが重要だと考えていました」と話す。
開業時から、オンプレミスが混在しない「フルクラウド環境」だというみんなの銀行。クラウド環境では、自責以外の障害も発生する。そのため同行では、アプリケーションレベルでリトライ処理を組み込み、不要なアラートを抑制するなどの対策を講じている。そこで対処できない場合はアラートを発報し、調査を開始する。現在はこの過程の自動化を進めており、迅速な障害要因の特定と、対応体制の確立を目指しているという。また、必要に応じて業務側へのエスカレーションも行うと宮本氏は説明する。
同行がフルクラウド環境を選んだ背景の一つには、「サービスの改善サイクルを早めて、プロダクトの質を高めていきたい」という理由がある。
「サービスやアップデートを頻繁にリリースすることは、障害発生リスクを高める要因にもなります。しかし、お客様のニーズや声に迅速に応えるためには避けられないことです。ですから、短期にテストをしっかりとして一定の品質を確保できれば、リリースする方針を採用しています。これは、みんなの銀行の存在意義にも関わります。リリース頻度を下げてしまえば、クラウド活用の利点であるスピードやアジリティを失ってしまうからです。我々は、この考えをチーム全体で共有しています」(宮本氏)
クラウドネイティブなアプリケーションには、オンプレミス環境とは異なる設計思想が必要だ。瞬断やリソース負荷の急増を前提としたアプリケーション設計が求められる。たとえば、アプリ上で振込や入金を行う操作を設計する場合、クラウド側の瞬断による内部的なリトライが発生しても、1回しか振込が実行されないような仕組みにしなければならない。何度も振込が行われてしまったら大変だ。
また、障害が発生した場合にも早期に復旧するため、運用をなるべく自動化し、アラートが発報された場合には、そのアラートを埋め込んだメンバーが対処する仕組みを採っていると宮本氏。アラートが発報されると電話が鳴り、それを設定した人、あるいはプロジェクトマネージャーなど、状況に応じた担当者が対処することになっている。つまり、アラートを出した人に責任が跳ね返ってくる仕組みというわけだ。
「アラート削減は、各自が考えるべき課題です。自分が設定したアラートには自分で対処し、不要なら最初から出さないようにします。運用担当者だけが対応に追われる状況は避け、全員がシステムの安定性に関与する文化にしていきたいのです。こうすれば、アラートが出ないように皆が工夫するようになります」(宮本氏)
CIOのようなリーダーの立場にある場合は、技術面だけでなくビジネス面からシステム障害と向き合うことも重要だ。障害がビジネスに与える影響は多岐にわたり、短期的な損失だけでなく、長期的な競争力や顧客信頼にも影響を及ぼす可能性も十分に考えられるからだ。さらに宮本氏は、他社のセキュリティインシデントを自分ごととして捉えている観点から、「セキュリティ投資は決して節約すべきではない」と考えている。
「私が特に重視しているのは、『セキュリティ』、『品質』、そして『保守/運用』の3点です。これらをおざなりにした開発は絶対に認めないと、常々チームには伝えています」(宮本氏)
今、金融庁はすべての金融機関に対し、セキュリティやガバナンスの強化を求めている。みんなの銀行は比較的新しく、銀行の中ではそれほど大規模ではないというが、他のネット銀行に劣らないセキュリティと品質を維持していると宮本氏。規模が小さくても、業界の標準を満たす、あるいはそれを上回る体制を整えていると語る。