AWS上に複数のデータリポジトリを持つデータ分析基盤を構築
第一三共の疾患領域は、「循環器」が中核だった。それが2016年からの中期経営計画でビジネスの転換目標を掲げ、主とする疾患領域を「がん」にシフトすると決める。従来の循環器では高血圧治療薬や抗血小板剤などを製造、これらの薬は低分子化合物だ。一方今後注力するがん領域では、抗体や遺伝子、細胞など、これまでとは異なるものを用いた治療を行う。そのため第一三共では、製造するものが大きく変わった。がん領域にシフトするには、これまで行ってこなかった新たなデータ分析が求められるからだ。
第一三共ではより高度なデータ分析、さらに研究から販売後に至るデータに対する統合的な分析が求められる。今回のトランスフォーメーションにふみきる以前から、同社ではデータ分析には積極的に取り組んできた。そのデータ分析では、プログラミングを行う社内人材不足、データの分散管理、データ資産の有効活用やデータガバナンスなどさまざまな課題があった。新たな高度なデータ分析のニーズに応え、その上で既存の課題も解決する。「その実現のために、データ基盤をAWSで刷新することにした」と言うのは、第一三共 DX企画部 DX企画グループ長の上野哲広氏だ。
データ分析とコンプライアンスのための体制を構築
社内外のデータの分析は、これまでも個別に実施してきた。今後は分散して存在するデータをまとめて、一元管理する。その上でデータを統合して分析できる環境も用意する。統合で新しいデータセットを作り、それに対し高度な手法で分析し知見を得られるようにする。これらを、データ分析基盤構築の目的として掲げた。また同時に、分析に利用するデータの信頼性を確保し、セキュリティ面、データのトレーサビリティなども実現したいと考えた。
これには、さまざまなソースから得られる異なるフォーマットのデータを統合するツールが必要だった。また統計解析に加え、AIや機械学習を活用する環境も用意しなければならない。またデータを扱う上でのセキュリティ確保、扱うデータがどこからいつどのように取得されたかのトレーサビリティなどの仕組みもいる。これらテクノロジー、分析、コンプライアンスに関わる課題は、IT部門だけで解決できない。第一三共では、実際にデータ分析を行うデータサイエンスを抱える事業部門と一緒に取り組む。
同社では既にAWSのクラウドを活用しており、さまざまなシステムがAWS上で稼働している。分析に利用する多くのデータがAWS上にあり、新たなデータ分析基盤をAWSで構築することは必然だった。その上で第一三共が思い描くデータ分析環境が、AWS上で構築できるかを確認する必要があった。まずは各部門で実施しているデータ分析が、AWS上で構築する新たなデータレイクで実現できるのかの検証が実施される。検証で上手くいく感触を掴み、AWSでのデータ分析基盤構築プロジェクトが本格的に始まる。