大塚製薬×AWSが切り拓く診断イノベーション/130億文字のゲノム解析を現場に届ける
AWS Summit Japan 2025:大塚製薬セミナーレポート
130億文字の"究極の個人情報"をAWSで守り抜くゲノム解析基盤
血液がん、いわゆる白血病は、発症から早い場合は2週間ぐらいで亡くなることもあるほど、急速に症状が悪化する疾患である。血液がんの患者がいつ来ても対応できるよう、「検査を止めない」をキーワードに、24時間365日稼働できるようにする。年間数万件の検査に対応できる仕組みの確立を目指したと大橋氏は打ち明け、解析プログラムの実装で重視した条件として「1. スケーラビリティ」「2. セキュリティ」「3. 安定稼働」の3つを挙げた。この3つを満たすことができると考え、選んだのがAWSである。大橋氏が説明したシステムアーキテクチャーは以下のようになる。
まず、ゲノムデータ解析のスケーラビリティを担保するため、下図のような処理フローを採用した。まず、APIをトリガーにAWS Lambdaにジョブを登録し、AWS SQSで同期させる。ジョブを取り出し、AWS Lambda経由で処理を実行する。このフローにしたのは、突然の検査需要に柔軟に対応できるようにするためだ。
次に、セキュリティを重視したのは、解析で扱うデータの特性上、最高レベルの保護が求められるものであったためである。ゲノム情報は1人ひとり異なり、「究極の個人情報」とも言われる。個人情報保護法、3省2ガイドラインを遵守したシステムにするべく、医療機関や検査センターからの接続では、AWS Direct Connect、AWS Site-to-Site VPNなどによる閉鎖ネットワークを利用する事にした。また、複数のAWSアカウントをアプリケーション実行用、データ格納用と使い分けることでデータ保護を強化し、Amazon GuardDuty、Amazon Detectiveを用いて、監視と侵入検知を行う設計を採用した。

3つ目の安定稼動で目指したのは耐障害性の担保である。Amazon ECSが起動できない時に備え、原因がわかったものに関してはAWS Step Functionsで自動的に再実行できるようにした。また、Amazon CloudWatchのログ監視と通知で、24時間365日運用を実現した。エラーの起きる確率は0.1%だが、検査需要に確実に対応できるよう、複数のAvailability Zoneを利用している。本番環境の監視体制にも万全を期した。医療機関や検査会社など、顧客からの問い合わせが直接来る時もあれば、監視システムの中からアラートが来ることもある。後者は週末や休日などはお構いなしだ。そこで、運用で発生するイベントは一元的に管理し、どちらも迅速に対応できる体制を構築した。
この記事は参考になりましたか?
- 冨永裕子の「エンタープライズIT」アナリシス連載記事一覧
-
- 大塚製薬×AWSが切り拓く診断イノベーション/130億文字のゲノム解析を現場に届ける
- 【ガートナー】エージェンティックAI時代のアプリケーション調達戦略/フランケンスタックの罠...
- SAPがパランティアと組んだ理由/SAP Business Data Cloudの戦略とは...
- この記事の著者
-
冨永 裕子(トミナガ ユウコ)
IT調査会社(ITR、IDC Japan)で、エンタープライズIT分野におけるソフトウエアの調査プロジェクトを担当する。その傍らITコンサルタントとして、ユーザー企業を対象としたITマネジメント領域を中心としたコンサルティングプロジェクトを経験。現在はフリーランスのITアナリスト兼ITコンサルタン...
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
この記事は参考になりましたか?
この記事をシェア