首页 | 官方网站   微博 | 高级检索  
     

一种规则和贝叶斯方法相结合的文本自动分类策略
引用本文:刘静,尹存燕,陈家骏.一种规则和贝叶斯方法相结合的文本自动分类策略[J].计算机应用研究,2005,22(7):84-86.
作者姓名:刘静  尹存燕  陈家骏
作者单位:南京大学,计算机科学与技术系,计算机软件新技术国家重点实验室,江苏,南京,210093;南京大学,计算机科学与技术系,计算机软件新技术国家重点实验室,江苏,南京,210093;南京大学,计算机科学与技术系,计算机软件新技术国家重点实验室,江苏,南京,210093
摘    要:文本自动分类技术是信息处理领域的重要研究方向,在介绍文本分类应用以及其关键技术的同时,讨论了几种文本分类方法,并且在对这些分类方法分析的基础上,提出了一种规则和统计相结合的文本自动分类策略。该策略通过规则方法来放宽贝叶斯方法所要求的强独立性假设条件,同时当规则不能满足时,可以通过贝叶斯方法来得到更好的分类结果。

关 键 词:文本分类  向量空间  概率模型  规则
文章编号:1001-3695(2005)07-0084-03

An Approach to Automatic Text Categorization Based on Combination of Rule and Bayesian Method
LIU Jing,YIN Cun-yan,CHEN Jia-jun.An Approach to Automatic Text Categorization Based on Combination of Rule and Bayesian Method[J].Application Research of Computers,2005,22(7):84-86.
Authors:LIU Jing  YIN Cun-yan  CHEN Jia-jun
Affiliation:(State Key Laboratory for Novel Software Technology, Dept. of Computer Science & Technology, Nanjing University, Nanjing Jiangsu 210093, China)
Abstract:In recent years, text categorization has become an important task in information processing. This paper introduces automatic text categorization, including its applications and its critical techniques. Furthermore ,it describes several classification methods which are frequently used ,and suggests a new classification method based on analysis of these methods.In this new method, rule is used to loose the strong independent condition required by Bayesian method,and Bayesian method is used to combine with rule method to get a better classification result.
Keywords:Text Categorization  Vector Space  Probability Model  Rule
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号