首页 | 官方网站   微博 | 高级检索  
     

基于知网的中文短信文本词汇链抽取方法
引用本文:刘金岭,刘丹,周泓.基于知网的中文短信文本词汇链抽取方法[J].计算机工程,2012,38(10):67-69.
作者姓名:刘金岭  刘丹  周泓
作者单位:1. 淮阴工学院计算机工程学院,江苏 淮安,223003
2. 沧州师范学院计算机系,河北 沧州,061001
基金项目:河北省科技支撑计划基金资助项目(10213581);淮安科技计划基金资助项目(HAG09061)
摘    要:提出一种基于知网的中文短信文本词汇链抽取方法。根据知网的语义关系,利用相同语义类给出上下文词汇项信息,构造多条词汇链,表达短信文本的多条叙事线索,从中抽取富含短信文本信息的词汇链,表达短信文本的语义信息,采用词汇链的关键词集合进行文本分类。实验结果证明,该方法的抽取准确率较高,文本分类速度较快。

关 键 词:知网  短信文本  词汇链  分类  关键词  统计信息
收稿时间:2011-07-20

Extraction Method of Chinese Short Message Text Lexical Chain Based on HowNet
LIU Jin-ling , LIU Dan , ZHOU Hong.Extraction Method of Chinese Short Message Text Lexical Chain Based on HowNet[J].Computer Engineering,2012,38(10):67-69.
Authors:LIU Jin-ling  LIU Dan  ZHOU Hong
Affiliation:1(1.Computer Engineering Faculty,Huaiyin Institute of Technology,Huai’an 223003,China;2.Department of Computer,Cangzhou Teachers College,Cangzhou 061001,China)
Abstract:This paper proposes a extraction method of Chinese short message text lexical chain based on HowNet.Information of context lexical item are given using same semantic class according to HowNet semantic relations.By constructing lexical chains or each,and some strong lexical chains with high quality can be extracted to express the semantic information of short messaging text and the key words using lexical chain set for text classification.Experimental results show that the accuracy of lexical chain construction method is superior,and greatly increases the speed of short messaging text classification.
Keywords:HowNet  short message text  lexical chain  classification  keywords  statistical information
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号