首页 | 官方网站   微博 | 高级检索  
     

中文文本的意群分类算法
引用本文:李志彤,易军凯.中文文本的意群分类算法[J].计算机工程,2013(8).
作者姓名:李志彤  易军凯
作者单位:北京化工大学信息科学与技术学院,北京,100029
基金项目:国家“863”计划基金资助重点项目
摘    要:目前中文文本分类算法大多利用词语或词语映射为特征项的分类方式,未考虑中文语法语义的特点,导致分类性能较低。为此,提出中文文本的意群分类算法。通过中文依存句法分析结果制定规则提取意群,并作为特征项表示文本,进而采用支持向量机的方法对训练集进行学习,最终构建类别意群库对测试文本进行分类。实验结果表明,与基于词语的分类方法相比,意群分类算法在分类性能上平均提升3个百分点,平均查准率达到97%。

关 键 词:文本分类  意群  支持向量机  语义概念  依存句法  类别意群库

Sense Group Categorization Algorithm for Chinese Text
LI Zhi-tong , YI Jun-kai.Sense Group Categorization Algorithm for Chinese Text[J].Computer Engineering,2013(8).
Authors:LI Zhi-tong  YI Jun-kai
Abstract:
Keywords:text categorization  sense group  Support Vector Machine(SVM)  semantic concept  dependency parsing  category sense group library
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号