首页 | 官方网站   微博 | 高级检索  
     

概念语义生成与文本特征选择研究
引用本文:孙福振,李贞双.概念语义生成与文本特征选择研究[J].计算机工程与应用,2011,47(30):116-118.
作者姓名:孙福振  李贞双
作者单位:1. 山东理工大学 计算机科学与技术学院,山东淄博,255049
2. 南阳师范学院 计算机与信息技术系,河南南阳,473061
基金项目:国家自然科学基金No.61003168; 河南省重大科技攻关基金(No.092102110274)~~
摘    要:文本特征选择是文本分类和信息提取的关键技术。针对文本分类中特征向量的高维稀疏问题,提出了非负矩阵分解和概念语义空间结合的特征抽取方法,对特征矩阵分解算法加入非负限制能够给出概念语义向量面向主题的解释,较好体现文本的局部特征。采用非负矩阵分解对全局和局部语义空间进行降维处理提高了体征提取效率,对不同概念语义空间中文本分类效果比对分析。实验结果表明基于非负矩阵分解的局部概念语义空间中文本分类精度较高。

关 键 词:概念语义空间  文本特征选择  非负矩阵分解
修稿时间: 

Research on concept semantic space and text feature selection
SUN Fuzhen,LI Zhenshuang.Research on concept semantic space and text feature selection[J].Computer Engineering and Applications,2011,47(30):116-118.
Authors:SUN Fuzhen  LI Zhenshuang
Affiliation:SUN Fuzhen1,LI Zhenshuang2 1.College of Computer Science and Technology,Shandong University of Technology,Zibo,Shandong 255049,China 2.Department of Computer and Information Technology,Nanyang Normal University,Nanyang,Henan 473061,China
Abstract:Text feature selection is a key technology of text classification and information extraction.For text classification with high dimensional sparse feature vector problem,a feature extraction method based on non-negative matrix factorization and concept semantic space is presented.This method gives the interpretation of the theme and better reflects the local characteristics of the text by adding the non-negative limitation to the matrix factorization.Experimental results show higher accuracy of the classific...
Keywords:concept semantic space  text feature selection  non-negative matrix factorization
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号