分析の効果が十分に出ていない企業が多い
デジタルトランスフォーメーションという言葉自体はそれほど新しいものではなく、同様にクラウドやIoT、AIといった言葉も世間一般に浸透しつつある。デジタルトランスフォーメーションの考え方の根底にあるのは、企業に存在するデータをアナリティクスという技術を使って、いかに企業の価値や利益にして競争力を高めていくかであり、ずっとSASが取り組んでいるテーマでもあるとした。
効果が出ない原因には、分析をうまく回せていない、分析の結果をうまく経営判断に反映できない、反映していてもそれが正しいかどうかを判断する基準がないなど、さまざまなことが考えられる。
分析のためのデータ準備がうまくいっていないこともあり得ると川上氏は指摘。一般的に、分析をする際にはその約80%の時間をデータ準備に費やすと言われている。また、40%の分析がデータの品質の低さによって失敗しているという調査結果もある。どんなに新しく高度な分析手法や最先端のAIを使ったとしても、正しく整備されたデータがないと正しい分析結果を生み出すことはできない。データをいかに正しく整備し、活用につなげていくか。アプローチをデータガバナンスの考え方とともに紹介する。
データガバナンスとは
川上氏はデータガバナンスについて、「企業のデータ活用戦略、目標、ポリシーを確立するための組織的な枠組み」と定義した。「データガバナンスをひとつください」という問い合わせを受けたこともあるというが、データガバナンスはソフトウェアの導入やシステムの構築で終わるものではなく、組織的な取り組みや枠組みを作ることであるとした。また、データガバナンスの推進における重要なキーワードとして、「網羅性」と「実用性」を挙げた。この相反する2つの要素のバランスが大事としている。
データガバナンスの取り組みをうまく進めていくと、データのありかがまず整理される。また、データ自体の信頼性も上がっていく。結果としてデータの活用の幅が広がり、より信頼度の高い分析結果が得られ、より高いビジネスバリューを生み出していくことにつながる。縛ることや管理することだけでなく、データの活用を促進できる仕組みであることを、まず理解すべきとした。
続いて川上氏は、データガバナンスの失敗要因を紹介した。これには「組織・体制」「認識」「効果」「リソース」の4つが挙げられる。「組織・体制」では、ワーキンググループや実行委員会など、組織が細かく分断されていて折衝、調整がたびたび必要になったり、業務とITの連携がうまくいっていないケースを例に挙げた。「認識」では、たとえば業務部門や責任者がデータガバナンスを正しく認識していないケースがある。これでは組織全体で取り組むことはできない。
「効果」は、効果が見えないというもの。データガバナンスを実現するには、組織に手を入れたりシステムソフトウェアの更新をしたりするので、投資対効果を問われてしまうケースだ。このようなケースは、データガバナンスを入れることが目的になっていると川上氏は指摘する。大切なことは、データガバナンスにより整理されたデータで何をするのかということであり、データガバナンスが利益に直結するケースは非常に少ない。「リソース」は主に人的リソースの問題で、川上氏は専任の担当者をきちんとアサインすることが重要であるとした。
フレームワークによりデータガバナンスを容易にする
川上氏はデータガバナンスフレームワークについて、その全体像を示した。大きく「ビジネス要件」「データガバナンス」「データマネジメント」「方法論」「適用ソリューション」に分かれている。まずはこれらの構成要素について説明した。
ます、「ビジネス要件」を明確にすることが重要。データガバナンスの取り組みそのものをROIに結びつけることは難しいため、投資を組織的な活動の推進要因、目的とできる限り紐づけることが必要になる。たとえば、企業統合が近いため法令遵守のためにデータガバナンスを使う。あるいは運用の効率化のための工数削減を目標にすれば、定量評価がしやすくなる。いずれにしても、課題と結びつけながら目指すべきゴールを明確にして、組織に所属する各個人に意識づけをすることが非常に大事なこととした。
「データガバナンス」では、一元化されたポリシーがきちんと計画、定義されていることが重要。ここでは企業文化や組織の壁、人員配置などの課題があるため、成果を判断するための「目標定義」、問題が発生した際に参照可能な行動指針となる「指導原則」、複数の部門から責任者をアサインしてデータガバナンスの活動を行う「意思決定組織・体制」、この組織に適切な承認権限を与え、活動原則の定義を維持する「権限委譲」の4つを必要な要素に挙げた。
「データマネジメント」は、データガバナンスのステップといえるもので、定義した各ポリシーを実際に導入していくための機能を表す。全体像では8つの機能が表示されているが、川上氏は特に「メタデータ」と「データ品質」の考え方が重要であるとした。メタデータには、業務メタデータとシステムメタデータ、そして運用メタデータの3種類が存在する。これらをしっかり把握、管理し、セキュリティ対策を施す必要がある。データ品質は、データの有効性や妥当性を検証し、ポリシーに沿って標準化することが重要とした。
データガバナンスとデータマネジメントの間に「データスチュワードシップ」とあるが、データスチュワードとはデータの専門家のこと。さまざまなシステムのデータに精通し、定義や利用方法に責任を持つほか、データガバナンスにおける部署間の調整や発生した問題の解決に取り組み、報告の責任も持つ。多くのスキルが必要とされるためアサインが難しいポジションである。そこで、各部門のスペシャリストを集め、バーチャルチームとして運用するケースも多い。
方法論では、「人員」「プロセス」「テクノロジー」が必要な要素となる。人員は主に役割を明確化する人員配置。プロセスは、効果測定のプロセスとコミュニケーションプロセスの2つがある。テクノロジーは次のソリューションともつながるが、データガバナンスを円滑に、そして効率的に実行するために必要な機能を自動化するようなツールのことで、SASではデータガバナンスに必要となる機能をすべて、ソフトウェアソリューションという形で提供しているとした。
データガバナンスを支える技術
川上氏は、データガバナンスは「仕組みを作ったら終わり」ではなく、PDCAを回していくことが重要であるとした。PDCAを回していくことで、主にルールとポリシーを最適化していく。そのすべてのフェーズに対応するのが、「SAS Data Management」製品群である。川上氏は「データガバナンスを支える技術」として、この中から「データ品質」「データプロファイリング」「ビジネス用語管理」の3つについて紹介した。
データ品質においては、ツールを活用することで組織内に存在するデータを可視化し、データの検証やパターン分析を実施できる。「データプロファイリング」では、ツールに標準で搭載されているプロセスの組み合わせにより、データのクレンジングが行える。「ビジネス用語管理」では、ツールによりビジネスメタデータを定義、分類が可能。クレジットカード番号などの項目をひも付け、項目やテーブルの関連性を自動的に表示される。ビジネス用語の辞書を作ることでデータの活用を促進し、トレーサビリティ・ガバナンスを担保できる。
続いて川上氏は、「AI Driven Data Management(AI技術を活用したデータマネジメントの効率化)」を紹介した。これは、リコメンデーションや異常検知の手法を使ってデータマネジメントを効率化する取り組みとなる。その背景には、企業が扱うデータはかつてのビッグデータに匹敵する量になっている状況がある。目視による運用を減らして、自動化、効率化を促進させるためには、AIが欠かせないものとなっている。
その具体的な技術として、まずデータ分類の効率化を挙げた。これは、データソースからデータを読み込む際に、その値に適したタグ付けを行うというもの。これにより膨大なデータの分類を効率的に行える。また、検討中のケースも含めると、たとえばデータが個人情報だった場合に適切な方法でマスキングまで自動的に行ったり、ビジネスメタデータを自動的にひも付けしたりといったことが可能になる。また、データのプロファイリングにより、次に必要なアクションをリコメンデーションしてくれる機能も計画している。たとえば、都道府県による分類ではデータ量が多すぎてしまうので、市町村で分類したらどうか、とデータ利用者に対して次に取るべきアクションを提案する。
一方で、AIで利用するモデルは、一時間の経過に従って、精度が低下していく傾向にある。これは実はよくあることで、データの傾向が変わっていくと効果が出にくくなってしまう。そのためには定期的なモデルの再学習、再適用が必要になるが、SASの場合は実データを使ったモデルの再学習を繰り返し、常にモデルを最適化する仕組みも今後、搭載していく。。
データガバナンスの3つのポイント
川上氏はまとめとして、まず「データガバナンスには組織全体での取り組みが必須、小さな成功体験も重要」を挙げた。組織に所属するすべてのメンバーが、データガバナンスのポリシーをきちんと理解し、組織全体で設定した目標に向かって推進していくことがとても重要。取り組みには、トップダウンによるスピード感も大事であるが、小さな成功体験をボトムアップで積み上げていき方針を意識づけることも有効であるとした。
次に「データガバナンスで効果を得るには、活用まで見据えたプラットフォームの選択が重要」を挙げた。データガバナンスできちんと効果を得るには、ビジネス要件とのひも付けを明確にし、PDCAを円滑に回すことも必要。また、ガバナンスによって整理されたデータを使って価値や利益を生み出すには、データの管理だけでなく、活用まで見据えたステップをシームレスに実現できるプラットフォームを選択することも重要になる。
最後に「SASはAIのリーディングカンパニーとして、AI Driven Data Managementにチャレンジ」を挙げた。SASはデータガバナンスをはじめとして、分析に必要な機能をすべてプラットフォームとして提供をしている。さらに長年にわたって培ってきたAI技術を活用して、DX時代のデータ活用にチャレンジしていくとして、セッションを締めくくった。