データ分析プロジェクトに対する誤解
2015年にNHK子会社社員が、自分たちが設立したペーパーカンパニーに架空の工事を発注することで、約2億円もの金額を着服していたことが発覚しました。この問題は様々なメディアに報じられたので、ご存知の方も多いと思います。実はこの不正が発覚した前年に、約1億円の費用をかけてNHKが監査法人などに不正調査を依頼していたにもかかわらず、この架空発注を発見できていなかったことが後から分かり、国会で批判的に取り上げられました(参照1)。
不正検知を目的としたデータ分析プロジェクトを実施する際に、不正行為を取りこぼすことに対する強い抵抗感から、分析を依頼した担当者が、「すべての不正を100%漏れなく検知する」という困難なゴール設定をしてしまうことがあります。過度な期待をかけることは、後日仮に検知できなかった不正が明らかになった時に失望を生み、結果として実施したプロジェクトは意味がなかった、という極端な評価さえ下してしまうリスクに至ります。このような誤解の多くは、プロジェクトをスタートする段階で、分析を依頼する担当者と分析担当者の間でプロジェクトの目的とゴールについて正しく認識合わせが行われていなかった場合に発生します。
データ分析プロジェクトを実施する目的とゴール
データ分析プロジェクトを実施する目的は以下の2つに大別されます。
- 分析結果を業務上の意思決定に利用する
- 不正検知モデルを構築しシステムに組み込む
目的によって目指すゴールは異なります。
1.分析結果を業務上の意思決定に利用する
過去に発生した不正の手口や傾向をデータに基づき分析し、その結果から得られたビジネス上の有意義な知見を、何らかの対策を打つための意思決定に利用することを目的としています。そもそもどのような手口でどれくらいの不正が発生しているのかが分からないため、それを明確にするためにデータ分析を実施します。冒頭に述べたNHK子会社社員の着服など、主に企業の内部不正を検知する場合のプロジェクトの多くがこれに当てはまります。このようなプロジェクトでは、経営層がコンプライアンス業務上の施策や判断を実施することが最終的なゴールとなります。分析結果は統計的な専門知識がない場合でも理解できるような分かりやすい形式で表現されることが望ましく、データ分析者は分析対象の業務についての深い理解が求められます。
2.不正検知モデルを構築しシステムに組み込む
従来、人手で実施していた不正の判別作業をシステム化し、より精緻な判別による不正行為の防止や、自動化によるコストの削減を目的としています。クレジットカードの不正利用やインターネットバンキングの不正送金など、既存のシステムを拡張しそこに不正検知の機能を実装するケースがこれに当てはまります。このようなプロジェクトでは、システムに実装する不正検知モデルを構築することがゴールとなります。金融機関では精度のみでなく分かりやすさも重視されることが多くあるため、モデルがブラックボックスにならないよう、用いるデータマイニング手法も目的に合わせて考慮する必要があります。