ビッグデータで進化する「プロファイリング」とは?
個人の経歴をまとめた「プロフィール」はフランス語”Profil”を語源とする。英語では”Profile”と綴られ、「プロファイル」のように発音される。その-ing形である「プロファイリング(Profiling)は、オックスフォード辞書*1によると「ある分野における能力を評価・予測するため、若しくは人々の分類の識別を支援するために、個人の精神的及び行動的特性を記録・分析すること」とある。
プロファイリングは、インターネットの登場によって、広告ビジネスの世界に広がっていく。ウェブ閲覧履歴を分析して、性別や年代を推測することはインターネット登場後まもなく盛んに実施されるようになった。近年はソーシャルメディアが普及し、「いいね!」ボタンを押したデータやリツイートのデータを集めて、個人の趣味嗜好をより精度高く推測できるようになった。また、スマートフォンが普及したことで、ネットに留まっていたデータに位置情報が加わり、現実の世界での行動特性もデータとして収集・分析できるようになった。
こうして個人に紐付く行動履歴データを集めて分析する、すなわち、プロファイリングすることによって、本人が誰か分からなくても、対象とする個人の人物像をかなり詳細に描くことが可能となっている(図表1)。プロファイリングを活用している代表的な企業であるグーグルは、あなたをどのようにプロファイルしているか確認できるサービスを提供しているので、試しにアクセスして、その精度を確かめてみるとよいだろう。
「ゆがんで見える金魚」となるリスク
個人の情報は、その部分、部分のみをとり出しても、ある特定の個人の全体像を浮かび上がらせることは困難である。しかし、部分的な情報が個人に付された統一的な番号で集められ、組み合わせられるならば、バラバラでは意味ないが、多数の部分の合成によって意味を持つようになるモンタージュ写真のように、個人を識別することが可能になってくる。ところが、個別的な情報のなかに誤っているものがある場合には、本人の真の姿をとらえることができなくなる。それは、あたかもいびつな金魚ばちに入れられて、ゆがんでみえる金魚のようなものである。
*出所)堀部政男「現代のプライバシー」岩波新書(1980年) 下線は筆者による。
これは、35年前に出版された堀部・特定個人情報保護委員長による「現代のプライバシー」の一節で、プロファイリングの本質を絶妙な比喩で表現したものである。最初の下線部分はプロファイリングの効用を、後ろの下線部分はその課題を言い表している。
プロファイリングは、対象とする個人が誰であるか分からなくても、同一個人に紐付くデータを組み合わせることで、その個人の人物像を描くことができる一方で、そうしたデータに不正確なものも含まれていた場合、描かれた人物像もゆがんでしまうリスクがある。またデータに誤りはなかったとしても、分析に用いるアルゴリズムによっては、本人に好ましくない人物像が描かれてしまうリスクがある。