首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 562 毫秒
1.
在深入学习和研究模板匹配分类理论和模式识别的过程基础上.利用模板匹配分类算法设计了一个图像分类器.该分类器通过对待分类样本与训练集中的样本之间距离的计算.对0~9这十类联机手写数字图像进行分类识别.  相似文献   

2.
一种面向不平衡数据的结构化SVM集成分类器   总被引:1,自引:0,他引:1  
为改进面向不平衡数据的SVM分类器性能,以结构化SVM为基础,提出一种基于代价敏感的结构化支持向量机集成分类器模型.该模型首先通过训练样本的聚类,得到隐含在数据中的结构信息,并对样本进行初始加权.运用AdaBoost策略对各样本的权重进行动态调整,适当增大少数类样本的权重,使小类中误分的样本代价增大,以此来改进不平衡数据的分类性能.实验结果表明,该算法可有效提高不平衡数据的分类性能.  相似文献   

3.
一种改进的结合K近邻法的SVM分类算法   总被引:2,自引:1,他引:1       下载免费PDF全文
在对支持向量机在超平面附近容易对测试样本造成错分进行研究的基础上,改进了将支持向量机分类和k近邻分类相结合的方法,形成了一种新的分类器.在分类阶段计算待识别样本和最优分类超平面的距离,如果距离差大于给定阈值可直接应用支持向量机分类,否则用最佳距离k近邻分类.数值实验表明,使用支持向量机结合最近邻分类的分类器分类比单独使用支持向量机分类具有更高的分类准确率.  相似文献   

4.
周靖 《计算机工程与设计》2011,32(12):4227-4230,4236
为解决KSVM分类器错分及拒分区域问题,提出了一种新的结合分类信息增益权重的改进KSVM分类器(classifica-tion information gain weight KNN&&SVM,CIGWKSVM)。采用熵期望值度量训练样本的复杂程度、特征集针对分类的不确定性以计算特征集的分类信息增益值,并融合特征分布信息定义训练集样本各条件属性在分类过程中的CIGW权重。在此基础上,设计围绕加CIGW权的欧式距离测度进行聚类处理,并优化选择错分、拒分区K近邻代表点的CIGWKSVM分类器。从理论上比较分析了CIGWKSVM分类器的性能,仿真实验结果表明,CIGWKSVM分类器在保证效率的情况下,分类精度得到了极大的提高。  相似文献   

5.
不平衡数据问题对传统的近邻分类器带来了很大的挑战,它的准则函数往往会使测试样本类别偏向于多数类,且参数对数据集有很强的依赖性。基于万有引力的固定半径近邻分类器(GFRNN)算法通过引入万有引力定律的思想,实现了一个针对不平衡数据的无参、高效的分类器,但GFRNN算法仅采用欧氏距离方法来计算半径和候选集。因此,基于GFRNN算法,在算法构造层面上提出了一种多视角学习框架MGFRNN。考虑到距离计算的多样性及所对应候选集的不确定性,在距离的计算中,采用欧式距离、一范数距离和切比雪夫距离三种度量方法,根据三种距离度量方法分别计算候选集半径,并计算候选集中各类样本对测试样本的万有引力大小,从而进行分类。实验结果证明,所提MGFRNN算法在比较算法中具有最高的分类精确度。  相似文献   

6.
针对光谱角制图(SAM)和最大似然(MLC)分类器对AVIRIS高光谱遥感图像进行植被分类精度均不高的问题,提出了一种基于多分类器的C5.0决策树植被分类方法。首先,利用支持向量机(SVM),进行核函数以及核函数参数选择,提取出AVIRIS高光谱图像中的植被信息。其次,利用C5.0算法将光谱角制图和最大似然分类器组合,作为决策树的特征属性,学习样本训练并生成分类规则;根据C5.0算法计算植被样本中对应分类器的信息增益率,选择信息增益率最大的属性去分类样本;当叶样本的分类结果满足停止生长的阈值,输出样本分类的结果,否则,回到开始,递归调用以上方法继续分类叶样本,直到所有子集仅包含一个植被类别的样本完成决策。实验结果表明,与光谱角制图和最大似然分类器相比,本文提出的方法整体精度分别提高了6.04%、2.92%,不仅证实了多分类器组合的可行性和有效性,而且更加适用于AVIRIS高光谱图像中的植被调查。  相似文献   

7.
针对支持向量机(SVM)在超平面附近进行不平衡数据(imbalanced datasets)分类的不准确性,提出了一种改进SVM-KNN算法,该算法在分类阶段计算测试样本与最优超平面的距离,如果距离差大于给定阈值可直接应用支持向量机分类;如果距离差小于给定阈值,则将所有支持向量都作为测试样本的近邻样本,进行KNN分类。通过对UCI数据集的大量实验表明,该算法在少数类样本的识别率和分类器的整体性能上有明显改善。  相似文献   

8.
提出了一种新颖的基于正交投影的分类器算法。该算法将测试样本正交投影到由各类训练样本生成的子空间中,并计算测试样本到各子空间的距离,以此作为分类的依据。该算法不需要计算样本协方差矩阵的逆阵,因此特别适合于小样本问题。在ORL人脸库上的实验结果表明,该算法的模式识别率高于传统分类器方法。  相似文献   

9.
Boosting算法在基因表达谱样本分类中的应用   总被引:1,自引:0,他引:1       下载免费PDF全文
基于基因表达谱结构提出一种基因表达谱的样本分类方法。首先用基因的Bhattacharyya距离衡量其所含样本类别的信息,过滤Bhattacharyya距离较小的噪声基因;然后修改重复剪辑近邻算法,剔除噪声样本;再基于Boosting算法构建支持向量机组合分类器;最后以结肠癌基因表达谱样本为例,进行了分类实验。实验结果表明该方法简单、有效,对基因表达谱样本的分类问题有强的实用性。  相似文献   

10.
针对邻域信息系统的特征选择模型存在人为设定邻域参数值的问题。分别计算样本与最近同类样本和最近异类样本的距离,用于定义样本的最近邻以确定信息粒子的大小。将最近邻的概念扩展到信息理论,提出最近邻互信息。在此基础上,采用前向贪心搜索策略构造了基于最近邻互信息的特征算法。在两个不同基分类器和八个UCI数据集上进行实验。实验结果表明:相比当前多种流行算法,该模型能够以较少的特征获得较高的分类性能。  相似文献   

11.
从局部分类精度到分类置信度的变换   总被引:2,自引:0,他引:2  
基于局部分类精度设计多分类器系统能够有效地提高分类正确率.目前流行的动态分类器选择方法不能充分利用各个基本分类器的信息.在动态分类器选择方法中,局部分类精度最高的基本分类器决定最终的分类结果,其他基本分类器的信息被忽略.提出了一种将局部分类精度变换为分类置信度的方法,从而可以利用度量层分类器融合方法对得到的置信度进行融合.与动态分类器选择方法相比,度量层分类器融合方法能够利用更多的信息,从而能够取得更高的分类正确率.ELENA数据库、UCI数据库和DELVE数据库上的大量实验表明,新方法在分类正确率方面超过动态分类器选择方法大约0.2%~13.6%.  相似文献   

12.
在计算几何组合分类器中,子分类器的权重分配一直未能充分利用空间视觉信息,使得分类器的可视化特性无法完全得到发挥.本文从类空间类别分布特性出发,提出基于类空间规整度的权重分配方法.该方法首先将子分类器由空间的类别表示转变为类别的空间表示,进而利用共生原则分析不同类别在空间中的分布规整度.由于分布规整度为类别分布信息的整体体现,可以用于刻画类空间中不同类别样本的离散程度,因此可以利用当前类空间的规整度信息作为该子分类器的权重.实验表明,利用规整度信息进行加权后的分类器不但与可视化特性更好的吻合,增强了分类过程的可理解性,而且在分类精度上得到了进一步的提升,扩展了应用领域.  相似文献   

13.
基于贝叶斯最优分类器的多源模糊信息融合方法   总被引:1,自引:0,他引:1  
苏宏升 《自动化学报》2008,34(3):282-287
为了使传统的贝叶斯最优分类器能够处理模糊信息和实现推理过程的自动化, 在这篇文章里我们将模糊信息嵌入到贝叶斯最优分类器中, 形成新的贝叶斯最优分类器. 它不但能有效地处理模糊信息, 而且还保留了贝叶斯最优分类器的学习性能. 再者, 根据模糊集理论的发展, vague 集也嵌入到贝叶斯最优分类器中形成 vague 贝叶斯最优分类器.它能同时模拟模糊信息正、反两方面的特征. 进一步, 提出能同时处理正、反和不确定三方面模糊信息的集对贝叶斯最优分类器. 最终, 为了实现贝叶斯最优分类器的自动推理, 提出一种基于知识的人工神经网络 (KBANN) 的贝叶斯最优分类器. 它不仅降低了贝叶斯最优分类器的计算量, 而且还改善了它的分类学习质量.  相似文献   

14.
在动态的数据流中,由于其不稳定性以及存在概念漂移等问题,集成分类模型需要有及时适应新环境的能力.目前通常使用监督信息对基分类器的权重进行更新,以此来赋予符合当前环境的基分类器更高的权重,然而监督信息在真实数据流环境下无法立即获得.为了解决这个问题,文中提出了一种基于信息熵更新基分类器权重的数据流集成分类算法.首先使用随...  相似文献   

15.
多标记分类器链中标记的预测顺序具有随机性,导致学习性能下降,容易造成错误信息的传递.考虑到标记的顺序性,文中提出基于多标记重要性排序的分类器链算法.该算法将标记间相互作用程度的大小作为衡量标记重要程度的依据,在标记相关性的基础上,按照重要性进行标记排序,并将排序结果作为分类器链算法中分类器的顺序,从而解决多标记预测顺序的问题.实验表明,相比现有方法,文中算法在多个数据集上能更稳定有效地分类多标记.  相似文献   

16.
相关因素对宏观经济风险影响的时滞分析是研究中国经济运行情况的重要问题之一,目前,主要采用数量经济方法进行宏观经济风险时滞影响分析方面的研究,但这些方法主要利用时序或非时序信息,不易实现二者的有机结合。k阶多马尔科夫链动态朴素贝叶斯分类器是一种特殊的动态贝叶斯分类器,在该分类器中,属性和类均构成马尔科夫链,通过朴素贝叶斯网络结构将这些马尔科夫链组合在一起形成分类器结构,从而使相关指标的动态和静态信息均能得到充分的利用,并将其用于宏观经济风险时滞影响分析。实验结果证明该分类器在时滞影响分析方面更加可靠和实用。  相似文献   

17.
标记间的相关性在分类问题中具有重要作用,目前有研究将标记相关性引入多标记学习,通过分类器链的形式将标记结果引入属性空间,为学习其他标记提供有用信息。分类器链中标记的预测顺序具有随机性,分类结果存在着很大的不确定性与不稳定性,且容易造成错误信息的传播。为此充分考虑标记的局部分布特性,提出了一种局部顺序分类器链算法,解决分类器链中分类器顺序问题。实验表明,该算法性能优于其他常用多标记学习算法。  相似文献   

18.
朴素贝叶斯分类器具有很高的学习和分类效率,但不能充分利用属性变量之间的依赖信息.贝叶斯网络分类器具有很强的分类能力,但分类器学习比较复杂.本文建立广义朴素贝叶斯分类器,它具有灵活的分类能力选择方式、效率选择方式及学习方式,能够弥补朴素贝叶斯分类器和贝叶斯网络分类器的不足,并继承它们的优点.  相似文献   

19.
This paper presents a method for combining domain knowledge and machine learning (CDKML) for classifier generation and online adaptation. The method exploits advantages in domain knowledge and machine learning as complementary information sources. Whereas machine learning may discover patterns in interest domains that are too subtle for humans to detect, domain knowledge may contain information on a domain not present in the available domain dataset. CDKML has three steps. First, prior domain knowledge is enriched with relevant patterns obtained by machine learning to create an initial classifier. Second, genetic algorithms refine the classifier. Third, the classifier is adapted online on the basis of user feedback using the Markov decision process. CDKML was applied in fall detection. Tests showed that the classifiers developed by CDKML have better performance than machine‐learning classifiers generated on a training dataset that does not adequately represent all real‐life cases of the learned concept. The accuracy of the initial classifier was 10 percentage points higher than the best machine‐learning classifier and the refinement added 3 percentage points. The online adaptation improved the accuracy of the refined classifier by an additional 15 percentage points.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号