排序方式: 共有16条查询结果,搜索用时 0 毫秒
2.
PAC-Bayes边界理论融合了贝叶斯定理和随机分类器的结构风险最小化原理,它作为一个理论框架,能有效评价机器学习算法的泛化性能。针对支持向量机(SVM)模型选择问题,通过分析PAC-Bayes边界理论框架及其在SVM上的应用,将PAC-Bayes边界理论与基于交叉验证的网格搜索法相结合,提出一种基于PAC-Bayes边界的SVM模型选择方法(PBB-GS),实现快速优选SVM的惩罚系数和核函数参数。UCI数据集的实验结果表明该方法优选出的参数能使SVM具有较高的泛化性能,并具有简便快速、参数选择准确的优点,能有效改善SVM模型选择问题。 相似文献
3.
主动贝叶斯网络分类器 总被引:26,自引:3,他引:26
在机器学习中,主动学习具有很长的研究历史。给出了主动贝叶斯分类模型,并讨论了主动学习中几种常用的抽样策略。提出了基于最大最小熵的主动学习方法和基于不确定抽样与最小分类损失相结合的主动学习策略,给出了增量地分类测试实例和修正分类参数的方法。人工和实际的数据实验结果表明,提出的主动学习方法在少量带有类别标注训练样本的情况下获得了较好的分类精度和召回率。 相似文献
4.
1 OPTIMALCONDITIONANDITSGEOMETRI CALCHARACTERSTheadjustmentmodelwithnobservationandm(m <n) parametersmaybewrittenaslr =yr(xa) erei ~N( 0 ,gij) ( 1 )where lr(r=1 ,2 ,… ,n)representscomponentsofobservations;er(r =1 ,2 ,… ,n)representscomponentsoferror;yr(ua) (a =1 ,2 ,… ,m)isassumedt… 相似文献
5.
针对传统支持向量机(SVM)算法难以处理大规模训练数据的困境,提出一种基于Hadoop的数据驱动的并行增量Adaboost-SVM算法(PIASVM)。利用集成学习策略,局部分类器处理一个分区的数据,融合其分类结果得到组合分类器;增量学习中用权值刻画样本的空间分布特性,对样本进行迭代加权,利用遗忘因子实现新增样本的选择及历史样本的淘汰;采用基于HBase的控制器组件用以调度迭代过程,持久化中间结果并减小MapReduce原有框架迭代过程中的带宽压力。多组实验结果表明,所提算法具有优良的加速比、扩展率和数据伸缩度,在保证分类精度的基础上提高了SVM算法对大规模数据的处理能力。 相似文献
6.
由互联网时代快速发展而产生的海量数据给传统聚类方法带来了巨大挑战,如何改进聚类算法从而获取有效信息成为当前的研究热点。K-Medoids是一种常见的基于划分的聚类算法,其优点是可以有效处理孤立、噪声点,但面临着初始中心敏感、容易陷入局部最优值、处理大数据时的CPU和内存瓶颈等问题。为解决上述问题,提出了一种MapReduce架构下基于遗传算法的K-Medoids聚类。利用遗传算法的种群进化特点改进K-Medoids算法的初始中心敏感的问题,在此基础上,利用MapReduce并行遗传K-Medoids算法提高算法效率。通过带标签的数据集进行实验的结果表明,运行在Hadoop集群上的基于MapReduce和遗传算法的K-Medoids算法能有效提高聚类的质量和效率。 相似文献
7.
8.
9.
高维特征空间中文本聚类研究 总被引:10,自引:2,他引:10
依据信息论的思想,从文档信息量变化的角度对文本聚类的过程进行了分析,指出了信息量在聚类过程中呈现的规律性,进而提出一种基于信息量模型的聚类分析算法。通过对高维特征空间中影响聚类准确率因素的分析,发现特征之间复杂的语义联系和过高的维度是影响文本聚类准确率的重要因素。从削弱特征之间的语义联系入手,提出了一种特征聚类算法,其算法复杂度与处理的文档数量无关,提高了高维空间下聚类的速度和效果。两种算法的结合使得对大量高维文本数据直接聚类变得可行,实际的测试中获得了满意的效果。 相似文献
10.
PAC-Bayes理论融合了贝叶斯定理和随机分类器的结构风险最小化原理,它作为一个理论框架,可得到最紧的泛化风险边界。分析了PAC-Bayes理论的研究背景和重要意义,介绍了PAC-Bayes理论框架及其在支持向量机上的应用,分别探讨了多种机器学习算法的PAC-Bayes边界,并特别对非独立同分布数据的PACBayes边界进行了分析。从4个方面深入阐述了PAC-Bayes边界应用的研究现状及进展,并对不同的研究方法和特点进行了比较。最后展望了PAC-Bayes边界未来的研究发展方向。 相似文献