首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
传统的Relief-F算法主要用于处理有标记数据集.针对部分标记数据集,引入一种基于耦合学习的数据样本相似度,设计了一种面向符号数据的基于Relief-F算法的半监督特征选择算法.为有效验证新算法的可行性,实验分析中选取了5组UCI数据集和3种常用机器学习分类器来进行验证,实验结果进一步验证了算法的有效性.  相似文献   

2.
针对Laplacian分值法进行特征选择时过分依赖样本局部结构信息的不足,提出一种改进的基于约束Laplacian分值的半监督特征选择算法。该算法利用样本之间的cannot-link成对约束关系作为全局结构信息,在进行特征选择时,不仅能尽量保持局部结构信息,而且还尽量保持了全局的cannot-link约束关系。基于Yale和PIE(Fave pose,Illamination,Expression dadbase)人脸数据库的实验表明,该算法性能显著优于Laplacian分值法,与Fisher分值法和最新的约束分值法相当,且在稳定性方面优于后者。  相似文献   

3.
针对影像分类中少量标记样本问题,提出了基于模糊粗糙集的影像半监督分类算法.首先,通过模糊粗糙集对数据的粗糙性与模糊性进行建模,采用归一化的模糊互信息来度量特征与类别信息的相关性,并利用模糊上下近似度量样本的类别隶属度;然后,结合归一化的模糊互信息改进正则化框架下的特征评价方法,在谱图分析的半监督特征选择框架下实现特征优选;其次,结合近邻约束提高模糊上下近似预测样本类别的准确性,设计基于模糊粗糙集的约束自学习,选择信息量大的未标记样本更新训练样本集;最后,利用新的样本集训练分类器,完成影像分类任务.多组实验表明所提算法能够在少量标记样本的条件下有效提高影像的分类精度.  相似文献   

4.
将视频集看成Grassmann流形上的子空间集合,结合半监督的拉普拉斯特征映射算法,即基于子空间相似性度量和具有标记子空间的类别信息,将视频集非线性地映射到低维欧氏空间,提出Grassmann流形上半监督特征映射算法对视频目标进行识别,该算法分别在步态视频数据库、人手姿势视频数据库和物体姿势视频数据库上进行了目标识别实验,并和典型的基于子空间相似性的分类算法的识别结果进行对比,证明该算法具有较好的性能。  相似文献   

5.
研究了基于偶对约束的半监督模糊聚类,将马氏距离引入到半监督模糊聚类SCAPC(semi-supervised fuzzy clustering algorithm with pairwise constraints)中,获得了一种新的半监督模糊聚类目标函数,通过求解优化问题,提出了一种基于偶对约束和马氏距离的半监督模糊聚类算法M-SCAPC(Modified-SCAPC).针对选择的标准数据集和人工数据集,对提出的算法M-SCAPC进行了实验研究,并与FCM(fuzzy C-means)、AFCC(active fuzzy constrained clustering)和SCAPC算法的聚类性能进行了比较,表明了提出的算法M-SCAPC在收敛速度和正确率方面的有效性.  相似文献   

6.
特征选择技术是数据降维的一种关键技术,由于采集到的数据样本标签信息缺失,无监督特征选择受到了更多人的关注.现有的无监督特征选择算法普适性及稳定性很低,受数据集结构的影响很大,因此很多研究者一直热衷于提高算法的稳定性.该文尝试从数据集的预处理出发,采用区间的方式来对数据集进行近似,得到与数据集相关联的几个数据集,通过实验...  相似文献   

7.
针对数据标注的代价昂贵和半监督学习难以直接处理高维数据,其包含的冗余特征往往导致分类模型效果不理想问题。为了解决上述问题,根据粒计算模型,提出基于一致性和知识粒度的半监督特征选择方法。利用正域的依赖度去度量有标记样本的一致性,同时采用知识粒度对未标记样本去评价特征对样本空间的可区分性,由此结合数据分布情况构造了一种基于线性融合的特征重要性方法。在此基础上,设计了面向半监督数据的特征选择方法。最后,通过实例分析和与当前四种半监督特征选择方法对比进一步验证了本文方法在半监督数据中的有效性和可行性。  相似文献   

8.
针对数据实际分布与假设不匹配时半监督学习算法难以改善分类器性能的问题,该文提出一种最大化样本可分性半监督Boosting算法,通过引入"高密度区域局部散度最小、样本空间全局散度最大"准则来学习未标注的样本。该准则使用两种半监督假设(聚类假设和流形假设),减少了因半监督假设与数据不匹配造成的准确率下降问题。实验结果表明,该文算法有效提高了Boosting算法在符合聚类假设数据集和符合流形假设数据集上的准确性,提高了分类器噪声数据的稳定性。  相似文献   

9.
10.
半监督学习贝叶斯分类   总被引:1,自引:1,他引:0  
分类器的学习采用半监督贝叶斯方法,使用EM算法求解最大似然估计,实验结果表明能够获得较好的结果。  相似文献   

11.
半监督学习研究进展   总被引:14,自引:0,他引:14  
半监督学习问题广泛存在于现实世界中,已经成为目前机器学习和模式识别领域中的一个研究热点.文章综述了半监督学习问题的基本思想、研究现状、常用算法及其一些应用领域,分析了目前存在的主要困难,并指出需进一步研究的几个问题.  相似文献   

12.
针对非平衡数据的半监督分类问题,提出了一种基于Biased-SVM的非平衡半监督分类算法.该方法首先利用初始的标记样本集训练处理不平衡数据的Biased-SVM模型,然后用训练好的Biased-SVM模型为未标记样本加上标签,再把新标记样本加入到初始标记样本集中,重新训练Biased-SVM模型,最后在测试集上进行测试.选取公共数据库里的一些数据集进行实验,首先在两类不平衡数据集上实验的结果表明,在标记样本所占比例为20%~80%时,所提方法能够在不降低数据集整体G-mean值的基础上,提高小类的F-value值并具有较高的稳定性;然后在多类不平衡数据集上实验的结果表明,在标记样本所占比例为20%~80%时,所提方法能够在不降低数据集整体的EG-mean值的基础上,提高小类识别率并具有较高的稳定性.  相似文献   

13.
分类学习算法的研究是计算机科学的研究热点,超图上顶点的分类问题作为一般图顶点分类问题的推广,被广泛应用于各种计算模型。对基于核方法的半监督超图顶点分类算法进行理论分析,给出算法的收敛性分析和广义界估计值。  相似文献   

14.
专家可为社区问答提供权威的答复,高效精准的专家发现有助于提升问答社区的服务质量.现有社区用户数据中存在噪声标签数据,且由于专家数量较少造成分类数据不平衡,从而降低了监督学习模型的专家发现精度.针对上述问题,本文提出一种基于特征扰动的半监督专家发现方法.该方法构建了一种无标签数据特征扰动策略,利用Sharpening算法实现无标签数据的伪标签化;基于ADASYN算法,通过构建专家用户邻近样本的方式扩充专家样本数据量,缓解分类数据的不平衡;构建联合损失函数,利用有标签和伪标签数据共同训练分类器,增强模型的泛化性能.实验结果表明,该方法在多个评价指标上优于已有模型和方法.  相似文献   

15.
针对原始K-means算法的一系列问题,提出一种基于半监督的K-means聚类改进算法,能够自动进行聚类,找出最优K值,并且最大限度地找出孤立点.首先根据样本集自身的特点,按照"类内尽可能相似"原则一步一步形成数据集,然后对数据集进行"去噪"与合并相似簇,最后,利用少量的标记信息指导和修正聚类结果.在UCI的多个数据集...  相似文献   

16.
为了更好地预处理未标记数据,大多数基于图正则的无监督特征选择算法通过构造样本的相似性矩阵来删除冗余信息并选择具有代表性的特征子集.这些方法中的大多数图都是用固定数量的近邻数来初始化,忽略了数据分布不均匀的问题.为了解决这个问题,提出了一种基于自适应邻域和自表示正则的无监督特征选择算法(Adaptive neighbor...  相似文献   

17.
通过将半监督学习的思想引入到模糊C-均值聚类方法中,提出一种基于半监督的模糊C-均值聚类算法,有效解决了模糊C-均值聚类算法随机选取初始聚类中心导致聚类结果局部收敛的问题,能客观获取最佳聚类数目和初始聚类中心.实验结果表明,与传统模糊C-均值聚类算法相比,基于半监督的模糊C-均值算法在一定程度上减少了迭代次数,降低了对初始聚类中心的依赖性.  相似文献   

18.
目前存在的无监督特征选择算法中往往会忽略特征与特征之间的关系,从而使得特征选择结果不理想.针对这个问题,提出了基于相似性特征聚类的加权无监督特征选择算法(Weighted unsupervised feature selection algorithm based on similarity feature clust...  相似文献   

19.
提高人脸识别算法的识别率,提出一种基于半监督局部线性嵌入(Semi-Supervised Locally Linear Embedding,SSLLE)的人脸图像识别方法。针对局部线性嵌入(Locally Linear Embedding,LLE)算法非监督学习的缺陷,引入半监督思想,在构造邻域的时候利用部分样本的标签信息来重新调整距离矩阵;使用调整后的距离矩阵进行线性重建从而实现数据降维。在Yale和ORL人脸库上的实验结果表明,能有效的提高人脸识别的性能。  相似文献   

20.
经典竞争凝聚(CA)算法具有自动寻找聚类总数的特性,避免了预判参数对聚类结果的影响,但在聚类过程中,该算法并未利用样本数据中普遍存在的少量已知信息,而这些已知信息往往能够对整个聚类过程提供有益的帮助;此外算法在相似度度量函数上采用了最为常见的欧氏距离,该距离仅适用于球状的聚类,且存在等划分的趋势,这就制约了算法的应用范围.针对上述问题,通过引入具有半监督学习能力的半监督项,增强隶属度矩阵的划分能力,并利用样本数据的点密度信息,生成距离调节因子修正欧氏距离,最终得到了基于点密度的半监督CA算法.在人造模拟图像和真实图像上的聚类分割结果,以及与其它算法的性能比较,表明了所得算法,能得到较为准确的中心值,有更佳的聚类效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号