兵庫県 神戸市は日立ソリューションズとともに、個人を特定できないような匿名化したデータを作成する実証実験を行い、分析への使用の有用性を確認したことを発表した。
神戸市は日立ソリューションズの協力のもと、統計情報から作成した個票形式のサンプルデータに、同じ属性を持つデータが複数件存在するようにk-匿名化を施した。これにより、k-匿名化後のデータを利用して基本的な人口や人口動態を分析し、有用な結果が出ることを確認したという。また、今回の実証実験でk-匿名化を行ったデータの1つをより活用しやすい統計情報に集計し、オープンデータとして公開している。
実証実験について
1.目的
匿名化したデータを利用して分析した結果が、匿名化していないデータの分析結果と比較して、割合などの傾向を把握するのに十分な精度であることを確認する。
2.期間
2020年7月31日~2020年10月15日
3.データレコード数
150万件(統計情報から作成したサンプルデータ)
4.匿名化対象の項目数
年齢、性別、国籍、住所などの10項目
5.方法
- 日立ソリューションズが、データの匿名化を実施する環境の構築を行い、神戸市と共同で住民基本台帳に基づく統計情報から作成した個票形式のサンプルデータについて、匿名化処理を実施
- 匿名化処理の実行基盤として分散処理技術「Hadoop」を利用し、大量データを高速・効率的に処理
- 日立ソリューションズが独自に開発したデータ匿名化ソフトウェア「Privacy Data Anonymizing Platform」を利用したk-匿名化処理を実施
- k-匿名化処理だけではk値を満たすことが難しい特異なデータについては、データ項目をカテゴライズするなど工夫し、k値を満たすデータを作成
6.実証実験で確認した結果
作成したデータについては、住民基本情報の分析に適したデータであることを神戸市が評価し、詳細なデータ分析ではなく割合などの傾向を分析するには、十分な精度であることを確認した。
神戸市では、今回の成果も参考にオープンデータ化を進めていき、さらなる市民サービス向上に取り組んでいくという。また、日立ソリューションズでは、クラウド上でのデータ利活用やオープンデータ化が今後も進んでいくことを見据えて、プライバシー情報匿名化ソリューションのさらなるサービスの拡充を進めていくとしている。
【関連記事】
・日立、自社のDX推進で帳票の読み取り・照合を自動化へ
・日立、ブロックチェーンを活用した電子署名サービスの社内先行運用を開始
・日立、PBIを活用した非接触型デバイスと生体認証SDKを提供へ