首页 | 官方网站   微博 | 高级检索  
     

融合词法和句法特征的汉语谓词高精度识别方法
引用本文:韩磊,罗森林,潘丽敏,魏超.融合词法和句法特征的汉语谓词高精度识别方法[J].浙江大学学报(自然科学版 ),2014(12):2107-2114,2195.
作者姓名:韩磊  罗森林  潘丽敏  魏超
作者单位:北京理工大学信息与电子学院
基金项目:北京理工大学研究生科技创新活动专项计划资助项目
摘    要:为了对汉语谓词进行系统的研究,提出一种融合词法和句法特征、结合C4.5机器学习和规则进行谓词识别的方法.该方法对句子的词法信息和句法信息分别进行特征提取,通过词法特征提取得到句子中可疑谓词及其个数,使用人工总结规则对词法特征进行规则过滤,对符合规则条件的样本直接给出结果,融合不符合规则样本的词法和句法特征,使用C4.5进行分类得到谓词识别结果.实验中,采用谓词总量达到20 000条以上的BFS-CTC标注语料库进行特征和参数选择、句法特征验证、训练数据量选择和算法准确性等一系列的实验,对谓词识别效果的影响进行研究.结果表明:句法特征能有效提升谓词识别效果,随着训练数据量的增加谓词识别准确率趋于平缓,达到了99%的高准确率.

关 键 词:谓词识别  句法特征  句义结构  语义分析  自然语言处理
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号