首页 | 官方网站   微博 | 高级检索  
     

基于SVM和CRF双层分类器的英文电子病历去隐私化
引用本文:程健一,关毅,何彬.基于SVM和CRF双层分类器的英文电子病历去隐私化[J].智能计算机与应用,2016(6).
作者姓名:程健一  关毅  何彬
作者单位:哈尔滨工业大学计算机科学与技术学院,哈尔滨,150001
摘    要:去隐私化是2014 i2b2/UTHealth中的一个任务,目的在于识别并移除电子病历中的隐私信息.本文提出了一种基于支持向量机(SVMs)和条件随机场(CRFs)双层分类模型的去隐私化方法,经过预处理将病历文本进行词切分(tokenize)处理,并在此基础上抽取4类特征,训练SVM模型对隐私信息实体边界进行划分并将结果作为特征添加到特征集中,通过CRF训练多分类器,并通过该分类器对各个类别的隐私信息进行识别.实验表明双层分类模型对于隐私信息识别是有效的,结果F值达到0.9110.

关 键 词:电子病历  去隐私化  SVM  CRF

De-identification on electronic medical records using a two tier classifier based on SVM and CRF
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号