カプコンは、ゲームタイトルを支える「カプコン共通基盤」にNew Relicが提供するオブザーバビリティプラットフォーム「New Relic」を導入し、システムのパフォーマンス可視化と運用の効率化を実現したとのことだ。
カプコンは、各ゲームタイトルが共通して使う機能を1つにまとめたバックエンドシステム「カプコン共通基盤」を開発し、2020年夏から運用しているという。共通基盤は、「アカウント管理」「(ゲーム利用者の)プロフィール管理」「同意規約管理」「ゲーム内通貨・DLC管理」「ID会員情報管理」の5つのシステムで構成され、複数のプラットフォームに展開されているゲームタイトルに対して、クロスプラットフォーム対応の共通機能やデータを管理・提供しているとのことだ。複数のゲームタイトルが利用しており、不具合が発生した場合の影響範囲が広いことから、24時間365日の安定稼働は不可欠だという。
共通基盤を安定して動作させるうえでは、インフラの状態をとらえるだけでなく、APM(Application Performance Monitoring)を活用することで、アプリケーションやミドルウェア、データベースなどの状態も併せて可視化し、異常を速やかに検知できるようにする必要があるという。
カプコンはその実現に有効なアプローチとして、システム全体の状況を包括的に可視化できるオブザーバビリティプラットフォームの導入を決定。共通基盤は、共通基盤のエンジニアが利用する「開発・負荷試験」用の環境と、ゲームタイトル側に提供する「開発から本番運用」のための環境に分かれているというが、このうち共通基盤のエンジニア向け環境では、オブザーバビリティが負荷試験環境のみに導入されており、性能評価や課題の洗い出しに活用されているとのことだ。
一方で、ゲームタイトル向けのシステムは幅広く利用されているため、課題によっては影響範囲が広がる可能性がある。そのため、開発から本番運用までの各フェーズでオブザーバビリティを活用し、迅速な異常検知と対応可能な体制が構築されているとしている。
New Relicの導入と効果
同社は共通基盤のプロジェクトが始動した2020年4月からNew Relicの検証をスタートし、同年7月に正式採用。New Relicはユーザー数に基づく明確な料金体系のため、コストの見積もりが立てやすいことが評価されたという。また、メトリクスとトレース、ログ、イベントといった多様なデータを収集・可視化する機能が単一のプラットフォームにすべて統合されており、各機能を導入するのが容易である点に加えて、New Relic日本法人による手厚いサポート体制も導入の決め手となったとしている。
New Relic導入後、以下のような効果が表れているという。
システムの包括的な可視化により対応や改善が迅速化・効率化
New RelicのAPMやログ、アラート機能を活用することで、開発から本番運用までの各フェーズにおいて、システム全体のパフォーマンスの包括的な可視化を実現。特に、New Relic APMの「External Services」は、共通基盤と連携する外部サービスのパフォーマンスを明確に把握できる機能であり、課題の早期特定と対応を迅速に行えるようになったという。またアラート機能は、社内で使用しているチャットツールと連携しており、関係者が状況を即座に把握できる体制を整えているとのことだ。これらの取り組みにより、障害対応時間の平均1時間の短縮に貢献しているという(カプコンの社内運用実績に基づく推測値)。
開発から本番運用まで、「TiDB」の監視・可視化を一元化
2024年9月にカプコンは、共通基盤における「アカウント管理」と「プロフィール管理」のデータベースを「TiDB」に切り替えた。TiDBは、PingCAPが提供している分散型のNewSQLデータベースで、「MySQL」との互換性を有するほか、性能拡張・縮小が自動化でき、メンテナンス作業もシステムを止めることなく行えるというもの。カプコンは、TiDBのライト版「TiDB Cloud Starter」を開発・QAなどの小規模なワークロード用に、エンタープライズ版「TiDB Cloud Dedicated」を負荷試験・ステージング・本番用に使い分けているという。
TiDB Cloud DedicatedにはNew Relicとの連携機能があり、リソース使用状況やクエリ情報を簡単に可視化できるとのことだ。一方、TiDB Cloud Starterはフルマネージドで利用者に運用の意識をさせないコンセプトになっており、最小限の監視機能のみが利用可能で、New Relicとの連携機能は実装されておらず、ダッシュボード上での可視化が困難だったという。
この課題に対し、カプコンではNew Relic APM内に蓄積されるデータベースクエリのメトリクスを活用することで、TiDB Cloud StarterについてもNew Relicによる監視・可視化が実現されているとのこと。これにより、開発から本番運用まで一貫したオブザーバビリティが確立され、課題の早期特定と迅速な対応が可能になっていると述べている。
TiDBをはじめとする新技術導入時の性能評価と円滑なリプレースを支援
新技術の採用時における性能評価(負荷試験など)にもNew Relicが活用されているという。TiDBの導入に際しても、試験段階からNew Relicを活用することで、課題の早期発見やアプリケーションの性能確認・評価が実施できたとのこと。また、APMベースの監視設定は従来のデータベースにも適用可能であり、事前に設定しておくことで、TiDBへのリプレース当日の作業負荷を軽減し、スムーズな切り替えが行われたとしている。
ダッシュボードの統一化と情報共有で、運用効率向上とコスト最適化
従来はログの収集と分析の仕組みに複数のツールが活用されていたが、今回の導入によってNew Relic Logsへとリプレースしてダッシュボードを統一化することで、運用・コストの最適化が実現されたという。また、ダッシュボードを通じた情報共有により、関係者が共通基盤の状況を的確に把握できるようになり、相互の意思疎通が円滑に進むことで、データに基づいた意思決定が加速し、運用効率が高いレベルで維持されているとのことだ。加えて、New Relicの活用として「監視設定のTerraform化」を導入しており、設定ミスの回避や各環境への展開の効率化が実現されているという。
カプコンでは今後、共通基盤を活用するゲームタイトルのさらなる拡充を推進するとともに、メトリクスの拡充や監視体制の強化、ゲームタイトルごとの共通基盤の利用状況の可視化、運用の自動化に向けた取り組みなどが計画されているという。
その一環として、New RelicのAI機能の活用も検討されており、ログ分析を通じて対応不要な事象を自動的に除外することで、エンジニアの運用負荷の軽減につなげていきたい考えのようだ。また、New Relicを活用したクラウドコストの一元化された可視化も視野に、2025年6月にNew Relicが発表したクラウドコスト管理ソリューション「Cloud Cost Intelligence」の導入も検討しているという。
【関連記事】
・New Relic、オブザーバビリティ技能の「認定資格制度」刷新 無料の学習コンテンツもアップデート
・東海コープ、「New Relic」を導入 システムトラブルの工数が最大20%削減
・「TimeTree」のサービス品質向上にNew Relicが貢献、エンジニアが全機能を使える環境整備
この記事は参考になりましたか?
- 関連リンク
- この記事の著者
-
EnterpriseZine編集部(エンタープライズジン ヘンシュウブ)
「EnterpriseZine」(エンタープライズジン)は、翔泳社が運営する企業のIT活用とビジネス成長を支援するITリーダー向け専門メディアです。データテクノロジー/情報セキュリティの最新動向を中心に、企業ITに関する多様な情報をお届けしています。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
この記事は参考になりましたか?
この記事をシェア