Apr. 24, 2020
公的統計の実証分析における秘密計算とその部分計算過程を公開することの安全性の検討
Secure Multi-Party Computation in Empirical Analysis for Official Statistics and Examination for Security of Its Partial Computation Process in Disclosure
要旨Abstract
公的統計ミクロデータの新たな利用形態として,「オンサイト施設」と「オフサイト利用」がある.日本におけるオンサイト施設の利用は,平成29年1月から試行運用が開始された.しかしながら,オフサイト利用の環境は未だ整っていない.本論文では,オフサイト利用のセキュリティ課題に着目し,データを暗号化した状態で集計ができる「秘密分散・秘密計算システム」の適用を試行する.公的統計ミクロデータや当該データから得られる集計表や各種統計量の提供においては,統計的開示抑制(Statistical Disclosure Control:SDC)(Hundepool, et al. (2012))が必要となるが,このSDCに対応した秘密分散・秘密計算システムの実現例はほとんどない.特に,秘密計算は,暗号化していないデータ(平文)を用いた通常処理と比べ計算時間が増加することから,計算時間の増加を抑制しつつSDCに対応した秘密計算の実現が課題となる.本論文では,公的統計でよく用いられる線形回帰および主成分分析に焦点を当て,計算時間の増加を抑制しつつSDCに対応した秘密計算の提案を行う.この提案技術の特徴は,SDCに対応した線形回帰や主成分分析において,個人のレコードを用いず統計量のみでも計算可能な処理部分を明らかにし,当該処理部分においては秘密計算ではなく通常の平文の処理とすることで計算時間の増加を抑制することである.この提案手法を秘密分散・秘密計算システムに実装し,すべての処理を平文で計算した結果と比較した.その結果,いずれの計算においても平文と同等の精度で分析ができていることを確認した.
Secure multiparty computation (MPC) is a cryptographic technology in which a researcher can analyze of data while the data is kept encrypted. Although MPC can be used for researchers to securely perform statistical analysis in their own labs, a dedicated algorithm is required for the computation on encrypted data. In this work, we propose novel algorithms to perform linear regression and principal component analysis in MPC. We observe that some parts of these analyses can be computed from statistics, not individual records. Therefore, our algorithm computes statistics from individual records by using MPC, and obtain the final result from those statistics in the clear. We also investigate whether or not those statistics can be regarded as safe, and confirmed that the output using our algorithm is identical to the output in the clear by experiments.
書誌情報Bibliographic information
Vol. 69, No. 2, 2018 , pp. 145-159
HERMES-IR(一橋大学機関リポジトリ): https://doi.org/10.15057/29176
JEL Classification Codes: C44, C61, C88