基于生成对抗网络技术的医疗仿真数据生成方法 |
| |
作者姓名: | 向夏雨 王佳慧 王子睿 段少明 潘鹤中 庄荣飞 韩培义 刘川意 |
| |
作者单位: | 1. 北京邮电大学网络空间安全学院;2. 国家信息中心信息与网络安全部;3. 哈尔滨工业大学(深圳)计算机科学与技术学院;4. 鹏城实验室网络部 |
| |
基金项目: | 国家重点研发计划基金资助项目(No.2016YFB0800803,No.2018YFB1004005);;国家自然科学基金资助项目(No.61872110)~~; |
| |
摘 要: | 对结构化电子健康档案中行的概率分布进行建模并生成仿真数据非常困难,因为表格数据通常包含定类列,传统编码方式可能产生特征维数灾难的问题,从而使建模异常困难。针对这一问题,提出利用庞加莱球模型建模医疗分类特征的层级结构,并采用高斯耦合的生成对抗网络技术合成结构化的电子健康档案。实验表明,该方法生成的训练数据能够在保证隐私性的前提下,实现与原始数据仅相差2%的可用性差异。
|
关 键 词: | 生成对抗网络 表示学习 隐私性与可用性分析 电子健康档案 |
|