首页 | 官方网站   微博 | 高级检索  
     

快速的领域文档关键词自动提取算法
引用本文:杨春明,韩永国.快速的领域文档关键词自动提取算法[J].计算机工程与设计,2011,32(6):2142-2145.
作者姓名:杨春明  韩永国
作者单位:西南科技大学计算机科学与技术学院,四川绵阳,621010
摘    要:针对现有关键词提取算法需要大量训练数据及时间、常用词分词困难、互联网文档噪音等问题,提出了一种基于TF-IWF的领域文档关键词快速提取算法。该算法使用简单统计并考虑词长、位置、词性等启发性知识计算词权重,并通过文档净化、领域词典分词等方法提高了关键词提取的速度及准确度。对523篇学生心理健康领域文档的实验结果表明,该算法提取的文档关键词质量优于TF-IDF方法,且能在时间内完成。

关 键 词:关键词提取  中文分词  领域词典  启发式知识  时间复杂度

Fast algorithm of keywords automatic extraction in field
YANG Chun-ming,HAN Yong-guo.Fast algorithm of keywords automatic extraction in field[J].Computer Engineering and Design,2011,32(6):2142-2145.
Authors:YANG Chun-ming  HAN Yong-guo
Affiliation:(School of Computer Science and Technology,Southwest University of Science and Technology,Mianyang 621010,China)
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号