首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 421 毫秒
1.
基于覆盖的粗糙聚类算法   总被引:3,自引:0,他引:3  
传统的聚类算法大都得到了样本集的一个划分,类之间是严格的互斥关系,而现实世界中类与类之间往往没有明确的边界。该文将粗糙集理论引入到聚类分析中,提出了一种基于覆盖的粗糙聚类算法KMMRSC,它用多个中心点代表一个类,并用上、下近似来刻画样本的归属,类与类之间是一种覆盖关系。实验结果表明,该算法聚类质量优于k-均值算法,且能发现非球状簇。  相似文献   

2.
KNN算法是经典的文本分类算法.训练样本的数量和类别密度是影响算法性能的主要瓶颈,合理的样本剪裁可以提高分类器效率.文中提出了一种基于聚类的改进KNN分类模型.首先对训练集进行聚类,基于测试样本与簇之间的相对位置对训练集进行合理裁剪以节约计算开销;然后基于簇内样本分布进行样本赋权,改善大类别样本的密度占优现象.实验结果表明,本文提出的样本剪裁方法提高了KNN算法的分类性能.  相似文献   

3.
针对传统谱聚类算法初始化敏感引起的聚类效率与正确率不稳定问题,给出一种改进的谱聚类算法.该算法首先构造Laplacian矩阵并得到其特征谱空间,然后引入粒子群优化的FCM算法在该空间中寻找最优粒子作为初始类簇中心用以解决敏感问题.实验表明,与传统谱聚类算法比较,该算法的聚类结果更稳定,在较高维数据集上聚类效率与正确率有明显提高.  相似文献   

4.
针对训练样本中包含边界样本数量的多少对支持向量机分类的精度起主要作用,提出基于核模糊C均值算法(KFCM)先对样本集进行聚类,然后利用得到的模糊隶属度矩阵计算样本的模糊熵,通过设定阈值进行子空间样本的选择,最后将得到的子空间样本作为支持向量机(SVM)的训练样本。实验结果证实,由于应用了KFCM方法克服了一些传统样本选择方法在不知道样本类别的情况下,其无法较准确地对任意形状的簇的子空间样本进行选择,同时该方法保留了典型样本,减少了训练样本的数量,从而保证了分类器的性能和较高的训练效率。通过实验比较,该方法在选取子空间样本的性能上比传统的方法要好。  相似文献   

5.
针对遥感图像监督分类方法需要人工提取训练样本的缺陷,提出一种模糊K均值聚类(FCM)提取训练样本、支持向量机(SVM)进行分类的方法。算法首先用FCM进行初步分类得到隶属度矩阵并判断每个样本的类别号;然后根据隶属度矩阵提取每类样本中密集程度较高的样本作为训练样本;最后用SVM对样本进行训练、再次分类。该方法克服了SVM算法需要人工样本的缺点,改善了传统非监督分类算法的性能,UCI标准数据库Iris数据和遥感数据样本的实验结果证明了该方法的可行性。  相似文献   

6.
本文针对卡口环境及大样本情况下,基于样本数据量大时对测试图像使用RankSVM排名结果会很靠后,提出了一种新的基于随机森林和RankSVM的行人识别方法RF-SVM(RondomForest SVM)。首先,单个训练样本提取多维特征向量,经K-means算法将所有训练样本的特征向量聚类,根据随机森林得到测试目标的预测类别,在此类范围内采用RankSVM算法,将相似度排名顺序作为行人识别结果。与传统方法相比,本文引用了随机森林预测分类的方法,避免了测试图像与全体样本进行相似度匹配,仅在预测到的类别中使用RankSVM,这样得到的排名结果既准确又相对单一的RankSVM排名结果更靠前,聚类算法结合随机森林起到一个对样本数据初筛的作用。本文基于VIPeR样本库的实验证明,该方法对行人姿态变化具有鲁棒性,相比MCC[10]与RankSVM等文中实验列举的传统算法识别准确率高。  相似文献   

7.
在目标识别中,对于样本数较多且分布复杂的数据,若将所有训练样本用来训练一个单一的分类器,会增加分类器的训练复杂度,且容易忽视样本的内在结构,不利于分类。因此人们提出了混合专家系统(ME),即将训练样本集划分为多个训练样本子集,并在每个子集上单独训练分类器。但是传统ME系统需要人为确定专家个数,并且每个子集的学习独立于后端的任务,如分类。该文提出一种基于Dirichlet过程(DP)混合隐变量(LV)支持向量机(SVM)模型(DPLVSVM)的目标识别算法,采用DP混合模型自动确定样本聚类个数,同时每个聚类中使用线性隐变量SVM(LVSVM)进行分类。不同于以往算法,DPLVSVM 将聚类过程和分类器的训练过程联合优化,保证了各个子集中样本的分布上的一致性和可分性,而且可以利用Gibbs采样技术对模型参数进行简便有效的估计。基于人工数据集、公共数据集以及雷达实测数据的实验验证了该文方法的有效性。  相似文献   

8.
盛凯  刘忠  周德超  魏启航  冯成旭 《电子学报》2018,46(11):2642-2649
为了提高多类半监督分类的性能,提出了一种基于证据理论的多类协同森林算法(DSM-Co-Forest).首先,通过"多对多"模式将有标记的多类数据随机拆分为多个二类数据集,并以此训练二类基分类器;然后,利用多个基分类器同时对未标记样本进行预测,并利用证据组合算法挑选出可信度较高的未标记样本;最后,将高可信度的未标记样本加入到原训练样本中,以迭代更新其他的基分类器,从而提高分类器的整体性能.通过在一些公共数据集上进行实验,并与其他半监督分类算法进行对比,验证了所提算法的可行性和有效性.  相似文献   

9.
胡正平  赵淑欢  彭燕  王宁 《信号处理》2014,30(8):891-900
针对如何将近邻、子空间学习与稀疏表示结合起来解决稀疏分类计算量较大的问题。由于子空间中样本的类内散度小,类间散度大,且同类中所有样本对重构的影响相似,因此按类而非样本处理的思想更符合基于类重构误差进行分类的算法要求,为此提出一种基于近邻类加权结构稀疏表示算法用于图像识别。该算法首先利用线性类重构误差选取 个最近邻类,并将其对应的系数作为权值对投影后的近邻类加权,其次在投影子空间上,用 个类的加权训练样本集对测试样本进行结构稀疏表示,最后根据最小类重构误差得出分类结果。在AR,Yale B,MNIST,PIE数据库上的实验结果表明该方法在训练样本数较少的情况下获得较高的识别率且具有一定的鲁棒性。   相似文献   

10.
杜浩翠  谢维信 《信号处理》2021,37(5):735-746
针对扩展目标高斯混合概率假设密度(extended target Gaussian mixture probability hypothesis density, ET-GM-PHD)滤波器中的量测集划分问题,提出了一种改进的密度峰值聚类(improved density peak clustering, IDPC)量测集划分算法。首先,使用IDPC算法去除局部密度较低的杂波量测,以获得最有可能的目标生成的量测集。其次,将剩余的量测集聚类以获得空间上紧密联系的聚类簇和簇的聚类中心。最后,根据预测的具有较高权重的高斯分量的均值在每个簇上的投影,获得准确的量测集划分。实验结果表明,与现有的量测集划分方法相比,该算法在保持跟踪精度的同时,可以大大减少计算时间。   相似文献   

11.
刘煊  渠慎明 《激光技术》2022,46(6):808-816
为了解决基于监督学习的高光谱图像分类算法训练样本中存在的噪声标签会降低后续的分类精度的问题, 采用了一种基于低秩稀疏表示和改进光谱角制图(SAM)的高光谱图像误标签检测算法。首先对高光谱图像中信号子空间进行预测, 根据预测到的子空间对原始高光谱图像重构并去噪; 然后通过基于归一化的光谱角制图算法来获取每一类样本间的距离信息, 得到每类样本间的光谱相似度, 并利用密度峰值聚类算法得到每个训练样本的局部密度; 最后采用基于局部密度的决策函数对噪声标签进行检测, 使用支持向量机在两个真实数据集上验证。结果表明, 该算法比先进的层次结构的高光谱图像误标签检测算法提高了1.91%的总体精度。这一结果对高光谱图像分类是有帮助的。  相似文献   

12.
陈善学  王欣欣 《信号处理》2021,37(4):545-555
针对训练样本量少导致高光谱图像分类精度低的问题,本文提出了一种基于字典优化的联合稀疏表示高光谱图像分类方法。首先,采取基于层次聚类的波段选择方法降低高光谱图像数据维度;其次,结合空间信息将高光谱数据划分为多个子集,利用已知标签信息的训练样本标记各个子集中可能成为训练样本的像元,组成训练样本备选集,根据光谱相似度准则筛选备选集得到优化字典;最后,将优化字典用于联合稀疏表示对高光谱图像进行分类。通过Indian Pines数据集和Pavia University数据集仿真实验表明,本文提出的分类算法能够有效提高高光谱图像分类精度。   相似文献   

13.
基于随机森林算法的食源性致病菌拉曼光谱识别   总被引:1,自引:0,他引:1  
药品食品的安全问题一直是人们关注的重点。相比于传统的食源性致病菌光谱检测方法,拉曼光谱法具有检测范围广、检测灵活、光谱特征突出等特点。本文以常见的食源性致病菌为研究对象,利用拉曼光谱仪采集了11种食源性致病菌样品的132个拉曼光谱数据,提出了一种基于主成分分析和随机森林算法的分类模型。实验结果表明,主成分分析结合随机森林算法的分类模型可以将食源性致病菌区分开,且分类准确度可达到91.36%。  相似文献   

14.
张因国  陶于祥  罗小波  刘明皓 《红外技术》2020,42(12):1185-1191
为了减少高光谱图像中的冗余以及进一步挖掘潜在的分类信息,本文提出了一种基于特征重要性的卷积神经网络(convolutional neural networks,CNN)分类模型。首先,利用贝叶斯优化训练得到的随机森林模型(random forest,RF)对高光谱遥感图像进行特征重要性评估;其次,依据评估结果选择合适数目的高光谱图像波段,以作为新的训练样本;最后,利用三维卷积神经网络对所得样本进行特征提取并分类。基于两个实测的高光谱遥感图像数据,实验结果均表明:相比原始光谱信息直接采用支持向量机(support vector machine,SVM)和卷积神经网络的分类效果,本文所提基于特征重要性的高光谱分类模型能够在降维的同时有效提高高光谱图像的分类精度。  相似文献   

15.
To improve the classification accuracy and reduce the training time, an intrusion detection technology is proposed, which combines feature extraction technology and multiclass support vector machine (SVM) classification algorithm. The intrusion detection model setup has two phases. The first phase is to project the original training data into kernel fisher discriminant analysis (KFDA) space. The second phase is to use fuzzy clustering technology to cluster the projected data and construct the decision tree, based on the clustering results. The overall detection model is set up based on the decision tree. Results of the experiment using knowledge discovery and data mining (KDD) from 99 datasets demonstrate that the proposed technology can be an an effective way for intrusion detection.  相似文献   

16.
基于稀疏表示及光谱信息的高光谱遥感图像分类   总被引:11,自引:1,他引:10  
该文结合稀疏表示及光谱信息提出了一种新的高光谱遥感图像分类算法。首先提出利用高光谱遥感图像数据集构造学习字典,然后根据学习字典计算每个像元的稀疏系数,从而获得像元的稀疏表示特征,最后根据稀疏表示特征和光谱信息分别构造随机森林,通过投票机制得到最终的分类结果。在AVIRIS高光谱遥感图像上的实验结果表明:该文所提方法能够提高分类效果,且其分类总精度和Kappa系数要高于光谱信息和稀疏表示特征方法。  相似文献   

17.
非监督分类是极化SAR图像解译的重要手段,但其分类结果易受到高维特征的影响。针对此问题,本文提出一种结合特征选择和大尺度谱聚类的极化SAR图像非监督分类方法。该方法首先深入分析并提取了极化SAR图像分类中常用的特征参数,包括基于测量数据及其简单线性变换的特征和极化目标分解的特征。然后通过聚类森林特征选择算法进行特征降维处理,去除冗余信息。最后利用过分割产生代表点并构建原始数据与代表点间的二分图,通过大尺度谱聚类算法完成图像的非监督分类。实验结果表明,该方法能够选取有效的特征组合,并得到较为满意的分类效果。   相似文献   

18.
Based on purely spectral-domain prior knowledge taken from the remote sensing (RS) literature, an original spectral (fuzzy) rule-based per-pixel classifier is proposed. Requiring no training and supervision to run, the proposed spectral rule-based system is suitable for the preliminary classification (primal sketch, in the Marr sense) of Landsat-5 Thematic Mapper and Landsat-7 Enhanced Thematic Mapper Plus images calibrated into planetary reflectance (albedo) and at-satellite temperature. The classification system consists of a modular hierarchical top-down processing structure, which is adaptive to image statistics, computationally efficient, and easy to modify, augment, or scale to other sensors' spectral properties, like those of the Advanced Spaceborne Thermal Emission and Reflection Radiometer and of the Satellite Pour l'Observation de la Terre (SPOT-4 and -5). As output, the proposed system detects a set of meaningful and reliable fuzzy spectral layers (strata) consistent (in terms of one-to-one or many-to-one relationships) with land cover classes found in levels I and II of the U.S. Geological Survey classification scheme. Although kernel spectral categories (e.g., strong vegetation) are detected without requiring any reference sample, their symbolic meaning is intermediate between those (low) of clusters and segments and those (high) of land cover classes (e.g., forest). This means that the application domain of the kernel spectral strata is by no means alternative to RS data clustering, image segmentation, and land cover classification. Rather, prior knowledge-based kernel spectral categories are naturally suitable for driving stratified application-specific classification, clustering, or segmentation of RS imagery that could involve training and supervision. The efficacy and robustness of the proposed rule-based system are tested in two operational RS image classification problems.  相似文献   

19.
模糊C均值(FCM)聚类算法及其相关改进算法基于最大模糊隶属度原则确定聚类结果,没有充分利用迭代后的模糊隶属度矩阵和簇类中心的样本属性特征信息,影响聚类准确度。针对这个问题,该文提出一种新的改进思路:改进FCM算法输出定类原则。给出二元属性拓扑子空间中属性相似度的定义,最终提出一种基于属性空间相似性的改进FCM算法(FCM-SAS):首先,选择FCM算法聚类后模糊隶属度低于聚类置信度的样本作为存疑样本;然后,计算存疑样本与聚类后聚类中心的属性相似度;最后,基于最大属性相似度原则更新存疑样本的簇类标签。通过UCI数据集实验,证明算法不仅有效,还较一些基于最大模糊隶属度原则定类的改进算法具有更优的聚类评价指标。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号