基于聚类结构编码的差分隐私异构数据发布 |
| |
引用本文: | 高海燕,高晋阳,郑志华.基于聚类结构编码的差分隐私异构数据发布[J].计算机应用与软件,2023(7):18-25+60. |
| |
作者姓名: | 高海燕 高晋阳 郑志华 |
| |
作者单位: | 1. 晋中职业技术学院电子信息学院;2. 中北大学仪器与电子学院 |
| |
基金项目: | 国家自然科学基金项目(51475368); |
| |
摘 要: | 针对异构数据发布的隐私保护以及数据挖掘泛化性问题,提出一种用于聚类分析的异构数据差分隐私发布方案。为了解决处理隐私信息后缺乏正确引导的问题,将原始数据分组为集群,并利用集群标签对数据的集群结构进行编码,还为异构数据定制了一个同时考虑关系属性和集值属性的距离度量集群。在保留集群结构的同时迭代地概括原始数据。进一步在原始数据中加入噪声从而满足ε-差分隐私的要求。在满足差分隐私原则的前提下,提出一种同时处理关系数据和集值数据的不确定性算法,不同类型的数据以类似的方式进行匿名化。通过实验验证了该方法能够有效解决异构数据发布问题。
|
关 键 词: | 数据发布 异构数据 差分隐私 聚类分析 |
|
|