近期,我院彭顺顺、李皓麒、郭桃林等人主研完成的一篇隐私保护方面的研究论文“LDP-PPA: Local Differential Privacy Protection for Principal Component Analysis”在Information Sciences发表。论文作者包括来自我院的彭顺顺博士和郭桃林博士,李皓麒、王文昊研究生,东南大学董恺副教授以及澳大利亚联邦科学与工业研究院的Mengmeng Yang研究员。
主成分分析(PCA)作为数据挖掘领域的关键技术,面临隐私泄露风险等现实挑战。尽管本地差分隐私(Local Differential Privacy, LDP)能够通过保护个体数据隐私实现全局统计分析,但其在PCA任务中的应用仍存在精度瓶颈。为此,本文提出基于本地差分隐私的主成分分析方法(LDP-PPA),旨在实现隐私保护与主成分提取准确性的双重提升。LDP-PPA解决了两个核心挑战:异质属性均值计算与噪声干扰下的协方差矩阵构建。针对前者,由于传统LDP机制对异质属性添加同等级噪声会导致精度损失,LDP-PPA提出同质空间映射策略:先将异构数据映射至标准化空间,再结合截断拉普拉斯机制进行扰动,从而降低异质性对噪声敏感度的影响。针对后者,LDP噪声易破坏数据相关性特征,为此LDP-PPA设计了功能性区间划分机制,通过提升高功能性区间扰动概率,有效维持协方差矩阵的统计特性。此外,本文从理论层面证明LDP-PPA满足严格的ε-本地差分隐私,并在三个公开数据集上验证其性能。实验表明LDP-PCA在主成分提取准确性以及隐私-功能权衡方面较现有方法具有显著的优势。
论文链接:https://doi.org/10.1016/j.ins.2025.121962
论文所提方法的框架图
《Information Sciences》由爱思唯尔(Elsevier)出版社出版,是计算机科学和信息系统领域公认的高水平学术期刊。该期刊涵盖计算机科学、信息科学等多个学科,具有广泛的国际影响力,被中国计算机学会(CCF)推荐为 B 类期刊。