SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

最新イベントはこちら!

Data Tech 2024

2024年11月21日(木)オンライン開催

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けの講座「EnterpriseZine Academy」や、すべてのITパーソンに向けた「新エバンジェリスト養成講座」などの講座を企画しています。EnterpriseZine編集部ならではの切り口・企画・講師セレクトで、明日を担うIT人材の育成をミッションに展開しております。

お申し込み受付中!

EnterpriseZine(エンタープライズジン)

EnterpriseZine編集部が最旬ITトピックの深層に迫る。ここでしか読めない、エンタープライズITの最新トピックをお届けします。

『EnterpriseZine Press』

2024年秋号(EnterpriseZine Press 2024 Autumn)特集「生成AI時代に考える“真のDX人材育成”──『スキル策定』『実践』2つの観点で紐解く」

DB Press

米国疾病管理予防センター(CDC)のCDOらが明かす コロナ禍「激動の日々」

感染者数の把握、ワクチンの供給不足……、度重なる重要な意思決定のためにデータを迅速に供給

 刻一刻と状況が変化する新型コロナウイルス感染症(COVID‑19)。米国疾病管理予防センター(CDC)は市民の健康を守るため、連邦政府、州、市などがその時々の情報に翻弄されることなく、適切な対策をとることができるような情報発信を目指した。それを支えたのが、データのインジェスチョン(収集)から活用までのプラットフォーム「Enterprise Data Analytics and Visualization(EDAV)」だ。ここでDatabricksの「レイクハウス・プラットフォーム」を採用し、データの民主化を加速した。CDCはこのような取り組みが評価され、Databricksが優れたデータチームを讃える年次アワード「Databricks Data Team Awards」を受賞。Databricksが6月27日から30日(米国時間)まで米サンフランシスコで開催した「DATA + AI Summit 2022」で、CDCのチーフ・エンタープライズ・アーキテクト(CEA)のRishi Tarar氏、最高データ責任者(CDO)のAlan Sim氏が、Databricksの公共担当ゼネラルマネージャーのHoward Levenson氏と対談した。

公共機関がデータで抱える5つの課題とは

 DatabricksのLevenson氏はまず、同社の公共機関における事業について説明した。

画像を説明するテキストなくても可
Databricks 公共担当ゼネラルマネージャー Howard Levenson氏

 Databricksは2013年設立だが、3年後の2016年に連邦政府など公共機関向け事業「Databricks Federal」を立ち上げたという。「当時社員はまだ75人。それでもこの事業をやりたかったのは、世界をよくしたかったから」と振り返った。そのようなLevenson氏の熱心な思いもあって、現在45の連邦機関がDatabricksの技術を利用している。

 公共分野でデータに関する課題としてLevenson氏は、「レガシーのモダン化」「サイバーセキュリティ」「予測メンテナンス」「詐欺対策」「市民サービスの強化」の5つを挙げた。

画像を説明するテキストなくても可
クリックすると拡大します

 たとえばレガシーのモダン化。「連邦政府は早期からITを受け入れていたために、レガシーが多く残っている」とLevenson氏。連邦政府が抱えているデータセンターの数は1万2,000で、この数は2010年から変わっていないという。「これらデータセンターにはそれぞれデータソースがあり、連邦政府にとって大きな課題になっている」(Levenson氏)。

 重要なデータがサイロ化されているのに加え、データの量は右肩上がりで増えている。だが、政府側も手をこまねいているわけではない。先に米国国防総省(DoD)は、省内全体のデータ共有を改善すべく「DoD Data Decrees」としてデータに関する5つの政令を出した。データ共有の最大化、共通のインターフェイス仕様に基づくデータカタログなどを含むもので、「DoDだけでなく、公共機関は同じような課題にフォーカスしている」とLevenson氏は説明する。

画像を説明するテキストなくても可
クリックすると拡大します

 Databricksは「レイクハウス・プラットフォーム」などの製品をもち、データとAIの成熟モデルを敷いて顧客のデータ活用を支援しているが、公共機関に対しても同じだ。Levenson氏は「統合されたガバナンスモデルを持ち、データアナリティクスと機械学習のための様々なテクニックを活用するためには、すべてのデータが得られる場所が必要だ」と訴えた。

「データが製品」──迅速で的確な意思決定のために

 後半は、Levenson氏がCDCのTarar氏(CEA)と同Sim氏(CDO)に質問する形式で、コロナ禍におけるCDCのデータ活用の取り組みを聞き出した。

Levenson氏:この2年間は激動の年月だったと思います。コロナ禍になってからの取り組みを簡単に教えてください。

Sim氏:2020年12月にCDCの最高データ責任者(CDO)に就任しました。CDOとして、CDC内部だけでなく、州、領土、地域や部族のパートナー、連邦機関なども関係しており、難しくもありますがチャンスもたくさんあると思っています。

画像を説明するテキストなくても可
米疾病管理予防センター(CDC) 最高データ責任者(CDO) Alan Sim氏

 今回の感染症についてですが、我々CDCは感染症の突発的発生を熟知しています。それでもCOVID‑19が特異だったのは、その規模です。ジカ熱のようなものは局所的ですが、COVID‑19は世界的な流行であり、効率の良い対応が求められました。CDCの上層部や連邦政府に情報を提供するだけでなく、地域のコミュニティも情報を必要としていました。これは、とても挑戦的な課題でした。

 データの共有は当然重要ですが、CDCのデータ使用合意や規制についても考えなければなりませんでした。月次の報告ではなく、病院、介護施設、リーダーシップなどにリアルタイムに近い情報を提供するという点で、大きな挑戦となりました。

 コロナが特異だったもう一つの点として、時間の経過とともにデータが変化すること。ウイルスについての理解が進むにつれて、追跡するものが変化しました。最初は感染者数、死亡者数を追跡していましたが、検査ができるようになり、病院のベッド数、マスクやゴーグルなどの個人用防護具(PPE)の在庫、そしてワクチンが出てくるとワクチンの数も調べなければなりません。

 このように、先を見越して計画できない状況で、新しい研究や情報が入ってくるとそれに合わせて迅速に適応することが求められました。さらに、それを拡張させ、その情報を取得して処理するパイプラインも構築し、収集してレポートを作成しなければなりません。

 Rishi(Tarar氏)が話すと思いますが、CDCは数年前に「Data Modernization Initiative(DMI)」をローンチしていました。DMIとは、公衆衛生にフォーカスしてシステムをモダン化する取り組みです。今お話ししたようなコロナ禍での取り組みは、結果としてこのDMIをさらに加速させることになりました。

Tarar氏:この2年はコンピューターの前にかじりついていましたね。特に重要な業務だったのが、検査やデータのバックボーンを構築することです。

画像を説明するテキストなくても可
米疾病管理予防センター(CDC) チーフ・エンタープライズ・アーキテクト(CEA) Rishi Tarar氏

 2020年3月にCOVID‑19テストのためのバックボーン構築に着手し、6週間程度で運用を開始しました。すぐに取り組んだのがデータの速度で、高速にするためにストリーミング機能の構築もしました。データそのものだけでなく、データにつながる出来事が精度の高い意思決定を加速させたのです。このように、たくさんの学びがありました。

 2020年5月~6月になると、検査が増えました。我々もスピードを速めて、地方や地域、国レベル、政府での意思決定のために、毎日夕方5時までに保健や健康に責任を持つ機関に正確な情報を届けました。

 このように、CDCの役割において、データが製品であるということがわかると思います。CDCは毎日指標を生成しますが、これらは信頼できるものとして科学的な裏付けが必要です。様々なステークホルダーから入手するデータから、意味のあるインサイト(洞察)を抽出し、これにより意思決定を加速します。

 CDCの重要な任務は、データの透明性と可観測性を強化することです。我々が構築した「Immunization Data Lake(IZ Data Lake)」は、Databricksのデータレイクである「デルタレイク」や「レイクハウス・プラットフォーム」を土台とし、コロナワクチンに関する匿名化されたデータの受け取り、保存、管理、分析などを行うデータリポジトリです。それ以前は伝統的なデータウェアハウスのアプローチで構築を試みましたが、結局Databricksの技術を使って構築しました。

次のページ
市民を最優先にしたデータパイプライン

この記事は参考になりましたか?

  • Facebook
  • X
  • Pocket
  • note
関連リンク
DB Press連載記事一覧

もっと読む

この記事の著者

末岡 洋子(スエオカ ヨウコ)

フリーランスライター。二児の母。欧州のICT事情に明るく、モバイルのほかオープンソースやデジタル規制動向などもウォッチしている。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

EnterpriseZine(エンタープライズジン)
https://enterprisezine.jp/article/detail/16343 2022/08/18 08:00

Job Board

AD

おすすめ

アクセスランキング

アクセスランキング

イベント

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング