首页 | 官方网站   微博 | 高级检索  
     

文本索引词项相对权重计算方法与应用
引用本文:蓝海洋,周杰韩,张和明.文本索引词项相对权重计算方法与应用[J].计算机工程与应用,2003,39(15):68-70.
作者姓名:蓝海洋  周杰韩  张和明
作者单位:清华大学自动化系,北京,100084
基金项目:国家自然科学基金项目“虚拟样机环境下复杂产品多领域协同建模方法研究”(课题编号:NSFC60274044)
摘    要:文本索引词权重计算方法决定了文本分类的准确率。该文提出一种文本索引词项相对权重计算方法,即文本索引词项权重根据索引词项在该文本中的出现频率与在整个文本空间出现的平均频率之间的相对值进行计算。该方法能有效地提高索引词对文本内容识别的准确性。

关 键 词:知识管理  文本分类  索引词权重
文章编号:1002-8331-(2003)15-0068-03
修稿时间:2003年1月1日

A Relative Text Item Frequency Weighting Method and its Application
Lan Haiyang Zhou Jiehan Zhang Heming.A Relative Text Item Frequency Weighting Method and its Application[J].Computer Engineering and Applications,2003,39(15):68-70.
Authors:Lan Haiyang Zhou Jiehan Zhang Heming
Abstract:The text classification accuracy depends on item frequency weighting.This paper proposes a relative text item frequency weighting Method.Namely,the weight of a term in a document is given by the difference of the term frequency in the document relative to the average frequency of the term over the documents.The new approach can effectively increase the accuracy of the terms identifying the document.
Keywords:Knowledge management  Text classification  Term weighting  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号