首页 | 官方网站   微博 | 高级检索  
     

朴素贝叶斯算法的改进与应用
引用本文:赵文涛,孟令军,赵好好,王春春.朴素贝叶斯算法的改进与应用[J].测控技术,2016,35(2):143-147.
作者姓名:赵文涛  孟令军  赵好好  王春春
作者单位:1. 河南理工大学计算机科学与技术学院,河南焦作454000;河南省普通高等学校矿山信息化研究重点实验室,河南焦作454000;2. 河南理工大学计算机科学与技术学院,河南焦作,454000
基金项目:河南省科技攻关项目(142402210435); 河南省高等学校矿山信息化重点学科开放实验室开放基金项目(ky2012-02)
摘    要:朴素贝叶斯算法是分类算法中最经典、最有影响的算法之一,但仍然存在一些不足之处.针对该算法中下溢问题,对算法基本公式进行了优化改进.针对NB算法中准确率问题,结合类别核心词思想和改进后的TFIDF算法,提出了一种基于类别核心词和改进型TFIDF的朴素贝叶斯CIT-NB算法.将改进后的算法应用于新闻数据集文本分类,实验结果表明,CIT-NB算法的分类性能明显优于原始朴素贝叶斯算法和基于TFIDF的分类算法.

关 键 词:朴素贝叶斯  下溢  核心关键词  TFIDF  文本分类

Improvement and Applications of the Naive Algorithm
ZHAO Wen-tao,MENG Ling-jun,ZHAO Hao-hao,WANG Chun-chun.Improvement and Applications of the Naive Algorithm[J].Measurement & Control Technology,2016,35(2):143-147.
Authors:ZHAO Wen-tao  MENG Ling-jun  ZHAO Hao-hao  WANG Chun-chun
Abstract:Naive Bayes algorithm is one of the most classical and influential classified algorithms,but it still has some aspects to be improved.To solve the problem of underflow,the fundamental formulae is improved.To improve the accuracy of the algorithm,a new algorithm named CIT-NB is proposed based on classified core words and the improved TFIDF algorithm.CIT-NB algorithm is realized in the experiment.Applying the CIT-NB algorithm introduced above to dataset of news classifying,the experimental results indicate that compared with NB algorithm,CIT-NB algorithm performs better in recall and precision,which proves the validity of CIT-NB algorithm obviously.
Keywords:naive Bayes  underflow  core words  TFIDF  text classification
本文献已被 万方数据 等数据库收录!
点击此处可从《测控技术》浏览原始摘要信息
点击此处可从《测控技术》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号