SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

直近開催のイベントはこちら!

EnterpriseZine編集部ではイベントを随時開催しております

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けの講座「EnterpriseZine Academy」や、すべてのITパーソンに向けた「新エバンジェリスト養成講座」などの講座を企画しています。EnterpriseZine編集部ならではの切り口・企画・講師セレクトで、明日を担うIT人材の育成をミッションに展開しております。

お申し込み受付中!

日本のデータベース研究最前線

個人情報保護法施行下のデータマイニング

第31回 集計状態のデータから相関ルールを推定する

個人情報保護法は、さまざまな分野に影響を及ぼしているようだ。だが、データマイニングにまでその影響が及んでいるとは知らなかった。しかし、本稿を読んでみればそれも納得である。今回は、個人情報に満ち溢れているスーパーマーケットのPOSデータを“集計”することで個人単位の購買履歴を特定することはできないが、現実世界(すなわち元データ)で何が起こっていたのかを高い信頼度で“推定”できる、新しい時系列パターンのマイニング技術を紹介してもらう。この分析手法は、日本データベース学会ビジネスインテリジェンス研究グループも共催団体の1つである「平成16年度データ解析コンペティション」で審査員特別賞を受賞した。 (DB Magazine 2007年3月号より転載)

取引記録の利用と個人情報保護

 大規模データベースからの知識発掘技術として、データマイニングはこれまで発展を続け、さまざまな分野で応用されています。例えば、ポイントカードを導入している企業のPOSシステムには、個人識別子、取引識別子(店舗、日時)、購入品目、金額などが記録され、このような記録から「ビールを購入した顧客はその後、頻繁にウイスキーを購入する」といったパターンを発見できます。こうしたパターンは「時系列パターン」と呼ばれ、仕入戦略や販売戦略を考えるうえで重要視されています。

 これまで、データマイニングでは発掘される事実、あるいはその使用目的がプライバシーの侵害に当たらなければ、分析対象データに個人情報が含まれていることはあまり問題にされていませんでした。

 しかし、それが個人の特定につながらないとしても、個々人がどの日時に何を買ったのかという詳細な記録が、第三者に分析されることに抵抗を感じる人は少なくありません。また、日本では2005年4月に個人情報保護法が施行され、近年、個人情報保護の立場から個人識別子を含むデータや、個人単位での細かい取引記録などの利用には細心の注意が必要となりました。

 それに伴い、元データに含まれている個人情報を保護したうえでのデータマイニング技術に注目が集まっています。そのような研究事例として、マイニング結果に影響しないように元データに改変を加える技術、あるいは、元データから個人特定につながり得る情報を、分析結果への影響がなるべく少なくなるように一般化あるいは削除する技術があります。

分析対象は集計データに移行

 しかし、そうした配慮を行なっても、現時点では個人単位の情報が第三者に分析されることに抵抗感を持つ企業や個人は多いようです。企業から筆者へ分析対象として提供されるデータも、個人情報保護法の施行を境に個人単位ではなく、集計済みのグループ単位のデータに変わってきました。

 集計済みデータならば、個人単位の行動記録を特定することはできないため、それを分析/利用することへの抵抗感も少なくなります。また、データを第三者に分析させる場合に、このような集計データの形態で提供することで、倫理的な問題も、情報漏えいによって顧客に被害が及ぶリスクもなくなります。

 一方で、相関ルールや時系列パターンなどを見つけ出すデータマイニング機能は、個人単位の取引記録から頻出パターンを枚挙する必要があるため、集計後のデータにはうまく適用できません。そのため、近年の個人情報保護の動きは、データの有効利用を目指すデータマイニング技術者にとって大きな足かせとなっています。

次のページ
時系列パターン発掘の方法

この記事は参考になりましたか?

  • Facebook
  • Twitter
  • Pocket
  • note
日本のデータベース研究最前線連載記事一覧

もっと読む

この記事の著者

森本 康彦(モリモト ヤスヒコ)

1991年広島大学大学院工学研究科博士課程前期修了。同年、日本IBM(株)東京基礎研究所。2002年12月より現職。博士(工学)。共著『データマイニング』(共立出版)など。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

EnterpriseZine(エンタープライズジン)
https://enterprisezine.jp/article/detail/127 2007/09/06 10:00

Job Board

AD

おすすめ

アクセスランキング

アクセスランキング

イベント

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング