基于SAS软件的地市级医院健康体检数据预处理方法探索 |
| |
引用本文: | 张丽君,黄艳艳,蒲杨,陈柯,徐凡,罗祥力,石丘玲.基于SAS软件的地市级医院健康体检数据预处理方法探索[J].中国医院统计,2023(1):64-70. |
| |
作者姓名: | 张丽君 黄艳艳 蒲杨 陈柯 徐凡 罗祥力 石丘玲 |
| |
作者单位: | 1. 重庆医科大学公共卫生学院;2. 川北医学院附属南充市中心医院健康管理中心;3. 川北医学院附属南充市中心医院妇科;4. 重庆医科大学超声医学工程国家重点实验室 |
| |
基金项目: | 国家自然科学基金面上项目(81872506); |
| |
摘 要: | 目的 系统分析当前健康体检数据的数据特征,利用Excel和SAS软件宏过程实现数据预处理。方法 利用某地市级三甲医院2017年10月至2020年12月健康体检数据平台中的健康体检数据,通过数据梳理总结当前体检数据的特征,制定相应的预处理规则,并基于Excel和SAS软件提出具体数据预处理方案、操作流程及宏代码。结果 通过Excel和SAS软件进行了健康体检数据的批量列名转换,使其符合SAS软件变量名命名规则;实现了多个不同结构的数据集合并而不出现截断值,保证了数据库的完整性;通过删除缺失变量和观察、合并重复变量和识别重复观察等过程,最终结合人工识别完成了体检数据预处理,形成了可供研究者进一步使用的健康体检数据库。在处理过程中编写了SAS宏过程,实现了数据预处理代码模块化。结论 通过Excel和SAS软件可以实现健康体检数据高效预处理、提高了数据质量、增加了数据可利用性,为数据库的利用和分析奠定基础,为健康体检数据的多中心研究应用的实现提供可能,具有一定的应用推广价值。
|
关 键 词: | 健康体检数据 预处理 数据清洗 SAS软件 |
|
|