データサイエンス組織がR&Dの悩みを解決するとどうなるか?塩野義製薬が取り組む「研究DX」
「SHIONOGI DATA SCIENCE FES 2026」レポート #02
2026年3月19日に塩野義製薬主催のオンラインイベント「SHIONOGI DATA SCIENCE FES 2026」では、同社社員による複数の講演が行われた。本稿では、森本健太郎氏(塩野義製薬株式会社 データサイエンス部 データサイエンス3 サブグループ長)が行った「SHIONOGIにおける研究DX」と題した講演の内容を紹介する。
データサイエンスの知見を活用した3ステップの問題解決
塩野義製薬のデータサイエンス部では、各メンバーが独自の知見を活用し、事業課題に対する解決方法を提供している。通常、そのプロセスは「1. ユーザーの要求理解」「2. ドメイン知識の獲得」「3. ソリューション提供」の3ステップで進む。依頼案件の中には、ユーザー要求の理解やドメイン知識の獲得に時間がかかるものもあるが、データサイエンスによる解決アプローチを採用し、迅速な課題解決が可能になる。
森本健太郎氏(塩野義製薬株式会社 データサイエンス部 データサイエンス3 サブグループ長)は、研究所の業務に焦点を当てた「研究DX」の3つの事例「骨髄細胞の自動分類」「動物行動薬効試験の自動化」「心電図波形解析による不整脈検出」を紹介した。この3つは、いずれも創薬プロセスにおける創薬研究と非臨床試験と呼ばれる初期の段階をターゲットとしている点で共通する。製薬会社における創薬研究は、人を対象としない非臨床の研究から始まる。この時、細胞やウイルス、マウス、モルモットなどから多くのデータを得る(動物を用いる試験においては3Rの原則に基づき動物福祉に配慮している)が、その形式は画像や動画から、波形、DNA配列に至るまで多種多様で、マルチモーダル解析が要求されることも多い。データサイエンス部のメンバーは、研究員同様の知識を持ち合わせていないため、冒頭で述べたような3段階で研究員が抱える問題にアプローチする必要があった。
まず、最初の事例として森本氏が紹介したのが、「骨髄細胞の自動分類」である。ユーザーからの要望は、骨髄塗抹と呼ばれる検査を効率化したいというもの。この検査は、採取した骨髄液をスライドガラスに薄く伸ばし、染色した標本を顕微鏡で拡大し、撮影した画像から細胞の形態によって約20に分類する。データサイエンス部の解析チームは専門の研究部門ではないため、骨髄塗抹とは何か、画像データの質や量がどの程度かを理解することから始めた。画像の中の細胞の種類の分類では機械学習の手法が使えるが、複数の手法の中から最適なものを選ばなくてはならない。さらに、細胞の分類と種類ごとの数の測定では、どんなアルゴリズムツールが必要か、作業フローの変更は可能かを見極める必要があった。
「骨髄細胞の自動分類」の事例
従来、マウスなどの実験動物に物質を投与する時、骨髄液への影響を確認するには、液中に含まれる細胞の種類を目視で分類しなければならず、非常に時間と負荷の大きい作業であった。その手順は次のようになる。
まず、前処理としてマウスから骨髄液を採取するところから始まり、顕微鏡で撮像して骨髄細胞の画像を取得する。1回の試験あたり500個の細胞を分類するとして、20種類の細胞形態を網羅するために15匹分の画像が必要になる。さらにこれを4つのグループに分けて検証を行う。3万個の細胞を分類しなくてはならず、1回の試験あたり約100時間以上を要していた。これでは解析にかけられる時間を確保することが難しい。また、画像から20種類の細胞に分類するスキルの習熟コストの問題から、スキルの保有者が少ないことも悩みの種であった。
AIを活用すれば、細胞分類に要する時間を減らし、解析時間を増やすことが可能になる。その目算から研究所でも実現可能性を検証したものの、最初は思うような精度が出なかった。相談を受け、データサイエンス部が加わる。データサイエンス部では、分類精度が出ない原因を探るため、存在比率が非常に少ない画像が存在することに着目した。検証の結果、問題の画像に関しては、擬似的な画像を加えた上で、画像を選抜して分類に適したものを学習に用いる改善策を講じることにした。また、画像収集支援と分類時に参照する学習用データをアップデートする仕組みを開発し、エンドユーザーに提供した。さらに分類フローも変更した。当初は画像撮像後、細胞のある部分を切り出し、続いて画像内の細胞を見るフローを考えていたが、画像は加工なしで全部を与えることに決める。そして、Mixup(2つのデータを加重平均して合成し、新しい学習データにする手法)やアフィン変換(行列を使う画像処理手法の1つ)などの前処理を加えることで、並列に画像を処理できるようにし、検出と分類を同時に行うより良いフローに改めた。
一連の取り組みが奏功し、改良直後には72%の精度を達成する。その後も改善策の検討を続け、最終的に実用上で熟練者とそん色のない83%の精度を達成した。森本氏は、従来100時間以上を要していた分類が、10分で完了するようになったと話した。
この記事は参考になりましたか?
- 冨永裕子の「エンタープライズIT」アナリシス連載記事一覧
-
- データサイエンス組織がR&Dの悩みを解決するとどうなるか?塩野義製薬が取り組む「研究DX」
- JTの医薬事業を継承した新生SHIONOGI、新薬開発期間の大幅短縮を実現した「AI高速創...
- BtoB SaaSは死ぬのか?生き残るのか? AIエージェント時代のアプリケーションビジネ...
- この記事の著者
-
冨永 裕子(トミナガ ユウコ)
IT調査会社(ITR、IDC Japan)で、エンタープライズIT分野におけるソフトウエアの調査プロジェクトを担当する。その傍らITコンサルタントとして、ユーザー企業を対象としたITマネジメント領域を中心としたコンサルティングプロジェクトを経験。現在はフリーランスのITアナリスト兼ITコンサルタン...
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
この記事は参考になりましたか?
この記事をシェア
