首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 571 毫秒
1.
属性约简是机器学习等领域中常用的数据预处理方法。在基于粗糙集理论的属性约简算法中,大多是根据单一的方法来度量属性重要度。为了从多角度对属性达到更为优越的评估效果,首先在已有的模糊邻域粗糙集模型中定义属性依赖度度量,然后根据粒计算理论中知识粒度的概念,在模糊邻域粗糙集模型下提出了模糊邻域粒度度量。由于属性依赖度和知识粒度代表了不同视角的属性评估方法,因此将这两种方法结合起来用于信息系统的属性重要度评估,最后给出一种启发式属性约简算法。实验结果表明,所提出的算法具有较好的属性约简性能。  相似文献   

2.
邻域粗糙集是数值型属性数据处理的有效工具.基于邻域粗糙集,传统依赖度及其约简未考虑邻域覆盖的绝对结构,由此文中建立加权依赖度及其启发式约简算法.首先,提出加权依赖度并得到其度量改进性与粒化单调性,定义相关的属性约简.然后,分析邻域半径的自适应取值,构造基于加权依赖度的启发式约简算法(NWDR).最后,在UCI数据集上进行对比实验,验证加权依赖度的单调性与NWDR的有效性.实验证明,加权依赖度改进传统依赖度的不确定性表示能力,NWDR具有较高的分类准确率与较强的应用适应性.  相似文献   

3.
王光琼 《测控技术》2019,38(8):54-60
传统的属性约简算法不能适用于动态变化的信息系统。为了对属性集不断动态增加的信息系统进行更高效的属性约简,基于粒计算模型中知识粒化的视角,提出一种知识粒度的增量式属性约简算法。在信息系统中引入知识粒度度量的概念,当信息系统属性集增加时,研究了知识粒度的增量式更新方法,理论分析了这种更新方法的高效性,根据知识粒度的增量式更新提出一种增量式属性约简算法。仿真实验结果表明该算法具有较高的属性约简性能。  相似文献   

4.
肖斌  孙乾智 《计算机仿真》2021,38(1):251-255
对于混合决策系统的属性约简,现有方法主要存在动态效果不佳、复杂度过高,以及约简精度差等问题,为此,提出一种启发式增量属性约简方法。针对混合决策系统的动态波动,基于粗糙集建立了邻域关系模型,根据邻域相对差异对增量属性进行更新。同时,为进一步增强约简算法的动态适应性,引入条件熵求解相对差异。考虑到单纯利用邻域依赖虽然有利于处理样本的分布不均,但是很难获得良好的属性评估,引入粒度模型进行优化,将邻域关系采用粒度重新描述,从而细化邻域关系。利用邻域依赖性得到决策属性度量,构造启发计算,同时,通过条件和决策间的关联度,以及粒度模型的单调,求解出条件和决策共同约束下的邻域关系。再根据决策属性度量作为启发,直至单一属性对子集决策性能不再有影响,完成属性约简。基于数据集的仿真,验证了提出的启发式增量属性约简方法能够降低约简冗余度和约简长度,有效提高属性约简精度和约简时间效率。  相似文献   

5.
阐述邻域粗糙集和邻域信息熵的基本定义及性质,为避免数值属性信息系统属性约简过程中,属性离散化造成特征信息的丢失,提出一种新的基于邻域信息熵度量数值属性约简算法。扩展邻域信息系统核属性集生成约简属性集,邻域信息熵度量不仅关注约简属性集正域变化,而且考察负域样本空间约简属性邻域等价类在决策属性划分的分布,具备更好的邻域关系度量细粒度。实验表明,对比邻域粗糙集近似度量、邻域有效信息率度量、邻域软间隔度量的属性约简方法,该算法能有效进行邻域信息系统属性约简的同时,也保持了约简属性集更好的分类精度。  相似文献   

6.
史进玲 《福建电脑》2012,28(7):1-2,6
为有效地处理序信息系统,基于粒计算理论提出一种新的序决策表约简算法。该方法首先将序信息系统转换为序关系矩阵,分析讨论序关系矩阵中粒计算模型和粒度度量方法,然后基于不同阶知识粒库,尝试在不改变序信息系统中序关系的前提下,从核属性集出发,结合启发式约简思路提出一种基于粒计算的序决策表约简算法。最后通过实例验证该方法的有效性。  相似文献   

7.
粗糙集的不确定性度量在知识获取中扮演着非常重要的角色。在邻域粗糙集理论中,当前不确定性度量方面的研究工作主要专注于度量单个知识空间的不确定性及其随粒度变化的单调性规律,其仍存在以下缺点:1)邻域粗糙集不确定性来自于邻域粒中属于目标概念的元素和不属于目标概念的元素,当前的方法没有同时考虑每个邻域信息粒的这两部分;2)不能反映不同知识空间对目标概念刻画能力的差异性;3)由于当前的知识距离包含了粒度划分的信息,已有方法在一些应用场合下不够准确,例如属性约简中的知识启发式搜索及其粒度选择。对此,文中首先构建了一种更加直观准确的邻域粗糙集的不确定性度量方法——邻域熵,并证明了不确定性度量随着粒度的细化具有单调性;为了反映不同邻域信息粒对目标概念刻画能力的差异性,提出了一种带近似描述能力的邻域粒距离,称为相对邻域粒距离,并介绍了它的相关性质;针对分层递阶的多粒度知识空间中的粒度选择问题,建立了基于边界域的邻域知识距离度量模型,该知识距离可以反映不同邻域知识空间对目标概念的刻画能力的差异性。  相似文献   

8.
信息熵体系是进行不确定刻画与近似推理的重要理论,已经被引入粗糙集进行数据分析与智能处理。经典的互补熵、互补条件熵和互补互信息能够刻画粗糙性与模糊性,该信息体系的拓展具有应用意义。本文基于邻域粗糙集,扩张构建邻域互补信息度量并研究其启发式属性约简。通过解析式模拟与信息粒替换,定义邻域互补熵、邻域互补条件熵和邻域互补互信息,得到系统方程、双界刻画和粒化非单调性;基于邻域互补互信息,提出非单调属性约简并设计启发式约简算法;采用决策表实例与UCI数据实验有效验证性质与算法。基于邻域扩张,相关信息度量与属性约简具有应用前景。  相似文献   

9.
赵小龙  杨燕 《控制与决策》2019,34(10):2061-2072
增量式属性约简是针对动态型数据的一种重要的数据挖掘方法,目前已提出的增量式属性约简算法大多基于离散型数据构建,很少有对数值型数据进行相关的研究.鉴于此,提出一种数值型信息系统中对象不断增加的增量式属性约简算法.首先,在数值型信息系统中建立一种分层的邻域粒化计算方法,并基于该方法提出邻域粒化的增量式计算;然后,在邻域粒化增量式计算的基础上给出邻域粒化条件熵的增量式更新方法,并基于该更新机制提出对应的增量式属性约简算法;最后,通过实验分析表明所提出算法对于数值型数据的增量式属性约简具有更高的有效性和优越性.  相似文献   

10.

属性约简是机器学习和知识发现的研究热点, 而属性重要性度量则是构建属性约简算法的关键环节. 针对不完备的混合型信息系统, 在邻域关系下定义了一种新的属性集成重要性度量—–邻域组合测度, 并据此提出一种基于邻域组合测度的属性约简(NCMAR) 算法. 通过多个UCI 数据集上的实验表明, NCMAR算法不仅能够直接处理符号和数值属性共存的混合信息系统, 而且适用于不完备信息系统, 在获得较小约简结果的同时, 能够保证较高的分类精度.

  相似文献   

11.
罗豪  续欣莹  谢珺  张扩  谢新林 《计算机应用》2016,36(11):2958-2962
针对当前的邻域粗糙集多用于处理完备的信息系统,而非不完备的信息系统这一问题,提出了一种可用于处理不完备混合信息系统的扩展容差关系,并给出相关定义,使用容差完备度和邻域阈值作为限制条件计算扩展容差邻域,以此邻域为基础选择决策正域得到系统的属性重要性,并以该重要性作为启发因子给出基于扩展容差关系的属性约简算法。采用UCI数据集中的7组不同类型的数据集进行仿真实验,并分别与扩展邻域关系(EN)、容差邻域熵(TRE)、邻域粗糙集(NR)的方法进行比较,实验结果表明,该方法在保证分类精度的同时能够约简得到更少的属性。最后讨论了在扩展容差关系中改变邻域阈值对分类精度产生的影响。  相似文献   

12.
属性约简是粗糙集理论中的重要问题。许多学者针对邻域粗糙集提出多种属性约简方法,包括应用最为广泛的启发式算法。在多半径邻域粗糙集的基础上,针对当前启发式约简算法往往会包含一定冗余属性的缺陷,提出一种融合属性权重影响的改进约简运算方法,通过根据各属性权值大小设置阈值使得约简结果能够消除冗余属性。实验选取UCI的数据集与当前几种常用启发式约简算法进行比较分析。实验结果表明,所提出的属性约简方法能够得到更优的约简集合,同时更大程度地保留了决策表本身的知识信息,具有较高的分类能力。  相似文献   

13.
在分析邻域粗糙集模型弊端的基础上,提出了非对称变邻域粗糙集模型,并以全局属性重要度为启发条件,构造了基于非对称变邻域粗糙集模型的属性约简的启发式算法.利用6个UCI标准数据集与现有算法进行了比较分析,结果表明,该模型不仅可以选择较少的属性个数,而且还能保持较高的分类能力.  相似文献   

14.
刘超  王磊  杨文  钟强强  黎敏 《计算机应用》2022,42(2):463-468
为了解决集值决策信息系统中的属性数量不断发生动态变化时,静态属性约简方法无法高效更新属性约简的问题,提出一种以知识粒度为启发信息的增量式属性约简方法.首先,介绍集值决策信息系统的相关概念,接着介绍知识粒度的定义并将其矩阵表示方法推广到此系统中;然后,分析增量式约简的更新机制,并基于知识粒度设计了增量式属性约简方法;最后...  相似文献   

15.
动态属性约简是粗糙集理论的重要研究内容之一.针对动态决策表构造了一种基于信息粒度的动态属性约简模型,详细分析了决策表中出现新属性动态增加时信息粒度的增量式计算方法;在此基础上,以信息粒度作为启发信息,设计了一种动态属性约简求解算法,该算法能有效利用原决策表的属性约简结果和信息粒度来降低算法的计算复杂度,并使得约简结果具有较好传承性;最后通过算例分析和实验比较进一步验证了本算法的可行性和有效性.  相似文献   

16.
序信息系统属性约简的一种启发式算法   总被引:5,自引:3,他引:2       下载免费PDF全文
在序信息系统中引入了知识的信息量和知识粒度的概念,得到了它们的若干性质和定理。证明了在知识约简过程中,信息量的变化趋势是递减的;利用信息量的概念,定义了属性的重要性,并以属性重要性作为启发信息,提出了一种基于信息量的属性约简启发式算法,该算法的时间复杂度为O(|A|3|U|2);最后通过例子说明,该算法能得到序信息系统的一个约简。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号