首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
混合数据的邻域区分度增量式属性约简算法   总被引:1,自引:0,他引:1       下载免费PDF全文
盛魁  王伟  卞显福  董辉  马健 《电子学报》2020,48(4):682-696
增量式属性约简是一种针对动态环境下的数据挖掘方法.目前已经提出的增量式属性约简算法仅适用于符号型的信息系统,而很少有对混合信息系统进行相关的研究,这促使在混合信息系统下构建相关的增量式属性约简算法.区分度是用于设计属性约简的一种重要方法,本文将传统的区分度在混合信息系统下进行推广,提出邻域区分度的概念,然后分别研究了邻域区分度在混合信息系统下对象增加和对象减少时的增量式学习,最后根据这种增量式学习分别提出了对应的增量式属性约简算法.UCI数据集上的相关实验结果表明,所提出的增量式属性约简比非增量式属性约简能够更快速的更新约简结果.  相似文献   

2.
决策表中基于条件信息熵的近似约简   总被引:2,自引:1,他引:2  
杨明 《电子学报》2007,35(11):2156-2160
属性约简是粗糙集理论的重要研究内容,已有效应用于机器学习、数据挖掘等领域.基于条件信息熵的属性约简可有效推广代数观下的属性约简,但存在抗噪声弱且某些情况下冗余属性多的不足.为此,本文在引入决策表中基于条件信息熵的近似约简概念后,提出决策表中基于条件信息熵的近似约简算法,该算法可有效增强抗噪性,且可依据实际应用的需要有效地对冗余属性进行取舍.最后,本文侧重通过选择不同精度下的约简属性子集在Benchmark上进行了分类器的性能测试.  相似文献   

3.
最小属性约简问题的一个有效的组合人工蜂群算法   总被引:1,自引:0,他引:1       下载免费PDF全文
粗糙集理论中的最小属性约简(MAR )问题是一个NP-难的非线性约束组合优化问题。本文提出一个新的求解MAR问题的组合蜂群算法,其中,引领蜂、跟随蜂和侦察蜂采用基于变异运算的搜索模式,在邻域候选蜜源的生成中引入与属性子集相关的两个度量,并且跟随蜂采用与引领蜂不同的局部搜索策略以提高搜索多样性。此外,在本文算法中,角色分工不同的蜂群以不同的方式利用迄今最好蜜源的信息进行搜索。在若干UCI数据集上的实验及其统计检验结果表明,本文算法在求解质量上优于其他的元启发式属性约简算法,因而可有效地应用于最小属性约简问题的求解。  相似文献   

4.
为进一步提高进化种群在粗糙集属性演化约简中寻求最优解的协同性能,提出了一种基于种群混合协同联盟的属性量子博弈均衡约简算法.该算法建立一种基于自适应多层进化树的种群协同演化联盟模型,以种群内个体竞争和种群间精英合作的混合协同机制实现各种群协同演化,较好地达到属性协同演化约简中广度寻优和深度探索的有效平衡;然后将信任裕度报酬机制引入到多种群精英量子协同博弈模型,种群精英在每个划分的属性子集中通过量子协同博弈策略均能求得各自最优约简子集,从而稳定取得Nash均衡下全局最优属性约简集.实验结果表明本文算法具有较高的属性演化约简效能和精度,对不完备电子病历系统中脑组织核磁共振成像MRI的高效约简与分割进一步展示其具有较强的实用性和鲁棒性.  相似文献   

5.
邓大勇  葛雅雯  黄厚宽 《电子学报》2019,47(5):1111-1120
属性约简是粗糙集的一个重要应用.一个数据集往往含有多个属性约简,人们一般用启发式算法找到其中的一个,再通过实验的方法验证其有效性.面对多个属性约简,人们往往难以区别,缺乏有效的手段选取最优或较优的属性约简.使用多种概念漂移的度量指标和信息损失的度量方法比较了同一个知识系统中不同Pawlak约简之间的区别与联系.提出了属性约简重心的概念,并研究其性质.实验结果显示,在众多的属性约简中,离重心最近的属性约简在分类准确率方面具有较大的优势.概念漂移的度量指标和信息损失的度量方法有助于区分不同的属性约简,属性约简的重心有助于在众多的属性约简中选择最优或较优的一个.  相似文献   

6.
在粗糙集核属性的基础上,融合小生境免疫优化提出一种决策属性约简方法.将核属性参数作为抗体编码的先验信息,通过疫苗自适应提取算法对抗体群接种疫苗,提高抗体群多样性及稳定性.为降低属性约简的计算复杂度,引入属性集合的分类近似标准作为免疫优化的亲和度,采用小生境免疫共享机制动态调整抗体群的亲和力,提高算法局部搜索能力.通过免疫记忆算子操作促使优良个体的保存,在保证收敛速度的同时具有较强的全局和局部寻优能力.通过滚动轴承故障诊断及UCI数据集的属性约简实验,显示本算法在属性约简精度和效率方面具有较好效果.  相似文献   

7.
黄鸿  王丽华  石光耀 《电子学报》2020,48(6):1099-1107
流形学习方法可以发现嵌入于高维观测数据中的低维流形结构,但是传统的流形学习算法都是假设所有数据位于单一流形上,忽略了高维数据中不同的子集可能存在不同的流形.针对上述问题,本文提出一种监督多流形鉴别嵌入的维数约简方法,并应用于高光谱遥感影像分类.该方法首先利用样本数据的类别标签进行多子流形划分,在此基础上采用图嵌入理论构造流形内图和流形间图,然后通过最小化流形内距离同时最大化流形间距离以增强类内数据聚集性和类间数据分散性,提取低维鉴别特征,改善地物分类性能.在University of Pavia (PaviaU)和Kennedy Space Center (KSC)高光谱数据集上的实验表明,相较于其他单流形算法和多流形算法,该方法取得了更高的分类精度,在随机选取2%训练样本时,其总体分类精度分别达到88.04%和84.53%,有效提升了地物分类性能.  相似文献   

8.
基于粗糙集属性约简的SVM异常入侵检测方法   总被引:3,自引:2,他引:1  
唐忠  曹俊月 《通信技术》2009,42(2):261-263
文章提出了基于粗糙集属性约简的支持向量异常入侵检测方法。为验证该方法的有效性,对实验数据集KDD99分别用粗糙集属性约简的支持向量分类方法和传统的支持向量分类方法进行实验仿真,并把两者的实验结果进行对比。实验证明,基于粗糙集属性约简的支持向量异常入侵检测方法在检测精度相当的情况下,有效的降低了检测时间并减少了存储空间。  相似文献   

9.
针对粗糙集模型中特征选择方法存在计算开销大、不能直接处理连续数据,以及海洋捕食者算法(MPA)处理优化问题仍存在收敛速度慢、易陷入局部最优等问题,提出了基于邻域粗糙集(NRS)和海洋捕食者算法的特征选择方法.首先,使用基于Tent混沌映射的反向学习和高斯扰动策略对原算法改进得到IMPA,再构建一种传输机制形成一种二进制算法;然后,基于邻域依赖度和特征子集长度构造适应度函数,使用IMPA不断迭代搜索出最优特征子集,设计一种元启发式特征选择算法.最后,在9个基准测试函数上评估IMPA的优化性能以及在UCI数据集上评估特征选择算法的分类能力.实验结果表明,在9个基准测试函数上IMPA的平均值、标准差明显优于粒子群优化算法(PSO)和樽海鞘算法(SSA);在UCI数据集上,同基于粗糙集的优化特征选择算法、基于邻域粗糙集的优化特征选择算法相比,所提的特征选择方法在KNN分类器下的分类精度平均值分别提高了10.28~14.13个百分点、2.71~12.11个百分点,在CART分类器下的分类精度平均值分别提高了9.41~13.24个百分点、2.90~12.31个百分点.  相似文献   

10.
基于粗糙集的文本自动分类方法的研究   总被引:4,自引:0,他引:4  
提出一种利用粗糙集理论生成文本分类规则的方法 ,通过将文本关键词的权值进行离散化处理后 ,作为规则的条件属性 ,文本所属的类别用作决策属性 ,构造决策表。然后通过属性约简和规则化简提取出文本的分类规则。该方法生成的规则易于理解 ,分类准确度较高 ,分类速度快。  相似文献   

11.
属性约简准则与约简信息损失的研究   总被引:5,自引:0,他引:5       下载免费PDF全文
属性约简是粗糙集的重要研究内容,信息熵是度量信息量的方法.在研究绝对约简和几种相对约简的基础上,归纳出属性约简的一般准则.定义了基于条件属性信息熵的属性约简和基于联合熵的属性约简,研究了几种属性约简与绝对约简之间的关系.定义了基于条件属性信息熵的约简信息损失,澄清了属性约简不损失信息的含糊观念,指出了属性约简只是在约简准则意义下不损失信息,在信息熵意义下可能损失信息.为进一步研究粗糙集、粒计算中属性约简与分类夯实了信息论基础.  相似文献   

12.
基于证据分类的DS证据合成及判决方法   总被引:14,自引:0,他引:14  
该文介绍了一种基于证据分类策略的修正DS证据合成方法,以解决证据冲突情况下的合成问题,该方法模仿人处理冲突信息时所采用的策略,即首先将证据分类,保证分在同一类中的证据具有较大的相似性,然后依据分类结果中各类证据的个数决定对该类合成结果的信任度并通过加权方法得到最终的合成证据。  相似文献   

13.
Multi-field packet classification using ternary CAM   总被引:10,自引:0,他引:10  
A new method for multi-field packet classification using a ternary CAM (TCAM) is presented. It is based on a preprocessing step that encodes classification rule information in the form of prefixes within an intermediate search key. The scheme enables TCAMs to handle larger rule sets more efficiently  相似文献   

14.
提出了一种新的基于图像块距离的邻域选择方法,并将其应用于流形学习中,得到一类新的高光谱图像非线性降维算法。该类算法利用高光谱图像物理特性,结合图像的光谱信息和空间信息,在最大限度减小图像信息冗余的基础之上,很好地保持了原始数据集的特性。与其它高光谱图像的降维算法相比,改进的流形学习算法不仅考虑到高光谱图像本身的空间关系,而且利用图像块距离更好地保持了数据点之间的局部特性,从而有效地去除原始数据集光谱维和空间维的冗余信息。实际高光谱数据的实验结果表明,所提出的算法在应用于高光谱图像分类时,与其它方法相比具有更高的分类精度。  相似文献   

15.
针对数据分类问题的局限,提出一种基于改进型深度数据流形的数据分类算法并将其应用到人脸识别中。首先,通过采集人脸图像的深度信息,利用稀疏表示对其进行去噪处理;再结合图像的颜色信息,重新生成三维人脸信息数据库,通过对人脸数据的流形分析得到最优的降维结果,按十字十乘交叉验证法的原则选取训练集和测试集,将训练集输入支持向量机算法建立数据分类器;最后,将测试集输入训练完成的分类器中,实现人脸数据分类。选取ORL,Yale两类人脸图像标准数据库与传统人脸识别算法进行交叉对比实验,验证算法的优越性和可行性。实验结果表明:所提出的算法有较高的分类准确率,可有效地完成人脸识别。  相似文献   

16.
粗糙集是粒计算的一种重要方法,数据异构性是大数据的一种特征.针对异构数据问题,探索了粗糙集属性约简的本质,提出了概念属性约简的定义,它兼容值约简、Pawlak约简和并行约简.探究了概念属性约简的性质,提出了异构数据的属性约简方法和概念漂移探测方法.理论分析和示例表明了这些方法的有效性.为粗糙集、粒计算融入大数据的时代潮流提供了一种新方法.  相似文献   

17.
滑文强  王爽  郭岩河  谢雯 《雷达学报》2019,8(4):458-470
该文针对极化SAR图像分类中只有少量标记样本的问题,提出了一种基于邻域最小生成树的半监督极化SAR图像分类方法。该方法针对极化SAR图像以像素为分类对象的特点,结合自训练方法的思想,利用极化SAR图像像素点的空间信息,提出了基于邻域最小生成树辅助学习的样本选择策略,增加自训练过程中被选择无标记样本的可靠性,扩充标记样本数量,训练更好的分类器。最终用训练好的分类器对极化SAR图像进行测试。对3组真实的极化SAR图像进行测试,实验结果表明,该方法在只有少量标记样本的情况下能获得满意的分类结果,且分类正确率明显优于传统的分类算法。   相似文献   

18.
19.
基于模糊粗糙集的新闻视频镜头边界检测方法   总被引:4,自引:1,他引:3       下载免费PDF全文
韩冰  高新波  姬红兵 《电子学报》2006,34(6):1085-1089
镜头边界检测是实现基于内容的视频检索的一个重要步骤.为了将视频分割成镜头,现有的方法大都是首先提取大量的特征然后构造相异性测度函数.然而,太多的特征就会降低算法的效率.因此,有必要对镜头边界检测的规则进行特征约简.本文将粗糙集中的属性重要性和模糊粗糙集中的分类精度相结合定义了模糊粗糙算子,并构造了相异度检测函数.最后给出了镜头边界检测的一般性规则.由于本文检测方案的自适应性,因此适合于各种类型的新闻视频.用来自中央电视台的3个多小时的新闻视频所做的镜头边界检测实验获得了95.4%的查全率和96.1%的准确率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号