排序方式: 共有47条查询结果,搜索用时 20 毫秒
11.
为提高多类支持向量机的分类效率,提出了一种基于混合二叉树结构的多类支持向量机分类算法。该混合二叉树中的每个内部结点对应一个分割超平面,该超平面通过计算两个距离最远的类的质心而获得,即该超平面为连接两质心线段的垂直平分线。每个终端结点(即决策结点)对应一个支持向量机,它的训练集不再是质心而是两类(组)样本集。该分类模型通常是超平面和支持向量机的混合结构,其中超平面实现训练早期的近似划分,以提升分类速度;而支持向量机完成最终的精确分类,以保证分类精度。实验结果表明,相比于经典的多类支持向量机方法,该算法在保证分类精度的前提下,能够有效缩短计算时间,提升分类效率。 相似文献
12.
13.
在垃圾邮件过滤中,考虑到特征词对合法邮件和垃圾邮件分类贡献的不同,通过定义分类贡献比系数,将特征词分类贡献的思想应用到特征选择和朴素贝叶斯过滤器的设计中,在英文语料库上进行实验,实验结果表明,应用特征词分类贡献的垃圾邮件过滤方法可以有效提高过滤器对合法邮件和垃圾邮件的识别能力,降低过滤器对合法邮件和垃圾邮件的误判率。 相似文献
14.
现有的垃圾邮件检测算法存在小样本情况下泛化能力差的问题。提出了利用核主成分分析和支持向量机结合进行垃圾邮件检测的方法。与传统算法相比,该方法与邮件异构有很高的检测率、更强的泛化能力和更高的检测效率。实验证明了方法的实用性和高效性。 相似文献
15.
提出一种基于句子相似度的论文抄袭检测模型。利用局部词频指纹算法对大规模文档进行快速检测,找出疑似抄袭文档。根据最长有序公共子序列算法计算句子间的相似度,并标注抄袭细节,给出抄袭依据。在标准中文数据集SOGOU-T上进行的实验表明,该模型具有较强的局部信息挖掘能力,在一定程度上克服了现有的论文抄袭检测算法精度不高的缺点。 相似文献
16.
17.
针对和声搜索算法易陷入局部最优的不足,提出了一种随机交叉全局和声搜索(RCGHS)算法。通过最差和声向最优和声学习提高算法的全局搜索性能,引入其他和声向最优和声学习的交互策略提高算法的局部搜索性能。将两种学习策略随机交叉动态产生新和声,平衡算法的全局搜索和局部搜索性能。在和声记忆库更新阶段,利用即兴创作产生的和声向量与随机反向学习产生的和声向量中较优的个体更新和声记忆库。将RCGHS算法与目前文献中较优的几种改进HS算法、ABC算法、PSO算法和GWO算法进行性能测试,测试结果表明RCGHS算法具有较高的寻优精度和较快的收敛速度。 相似文献
18.
基于支持向量机的网页分类技术是数据挖掘中一个研究热点领域.支持向量机是一种高效的分类识别方法,在解决高维模式识别问题中表现出许多特有的优势.但支持向量机本身是一个两类问题的判别方法。不能直接应用于多类问题.总结了当前常用的几种支持向量机多类分类算法。分别从训练速度、测试速度、分类精度三方面对这些分类方法进行了讨论,并给出了进一步的研究方向. 相似文献
19.
20.
多主题是文本的一个自然属性,即一些文本不是确定的属于单一主题,而是多个主题.对于这种情况,标准SVM多分类算法不能解决.本文提出一种基于模糊支持向量机的多主题文本分类算法.用1-a-1方法训练子分类器,对于待分类样本,通过子分类器得到对应其隶属度矩阵,依据隶属度矩阵每行元素和判定该文本所属主题.实验结果表明,该算法具有较好的准确率、召回率和F1值. 相似文献