首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 796 毫秒
1.
增量式属性约简是一种针对动态数据集的新型属性约简方法。然而目前的增量式属性约简很少有对不完备混合型的信息系统进行研究。针对这类问题提出一种属性增加时的增量式属性约简算法。在不完备混合型信息系统下引入邻域容差关系。基于邻域容差关系的粒化单调性,提出信息系统属性增加时邻域容差条件熵的增量式更新方法,并提出了不完备混合型信息系统下的邻域容差条件熵增量式属性约简算法。实验分析表明了该算法的有效性。  相似文献   

2.

属性约简是机器学习和知识发现的研究热点, 而属性重要性度量则是构建属性约简算法的关键环节. 针对不完备的混合型信息系统, 在邻域关系下定义了一种新的属性集成重要性度量—–邻域组合测度, 并据此提出一种基于邻域组合测度的属性约简(NCMAR) 算法. 通过多个UCI 数据集上的实验表明, NCMAR算法不仅能够直接处理符号和数值属性共存的混合信息系统, 而且适用于不完备信息系统, 在获得较小约简结果的同时, 能够保证较高的分类精度.

  相似文献   

3.
在容差关系下,针对属性集P在分类中的不同个体贡献,引入粗糙集的近似度概念,结合属于/不属于集合Rp(x)的元素贡献的不确定性,定义一种新的知识熵,从而实现基于近似度的不完备信息系统属性约简算法。仿真结果表明,与IEARA算法相比,该算法具有较高的约简效率。  相似文献   

4.
实际应用中,信息系统的数据常常是动态变化的,当对象增加时,原始的属性约简集不一定有效。针对不完备决策系统对象增加的情况,提出基于条件熵的增量式属性约简算法。首先定义不完备决策系统中的条件熵,然后分析对象增加时条件熵的变化机制以及对约简集的影响,提出增量式属性约简算法,当对象增加时,该算法能够更高效地进行属性约简。最后,实验验证本文算法的有效性和高效性。  相似文献   

5.
基于决策熵的不完备信息系统的知识约简方法   总被引:1,自引:0,他引:1  
为有效地解决不完备信息系统的知识约简,得到更优的决策规则集,研究了基于容差关系的决策熵在不完备信息系统中能客观反映决策规则的决策能力,提出了一种基于决策熵的不完备知识约简方法.该方法基于决策熵的思想,考虑了决策规则可信度和对象覆盖度,同时引入了容差关系,以决策熵的属性重要性度量为启发信息进行知识约简,最终得到确定的规则集.仿真实验结果表明了该算法的可行性.  相似文献   

6.
属性约简是粗糙集理论中重要研究内容,由于现实应用领域中决策信息系统往往呈现出不完备性特点,为此,首先将不完备决策表转化为集值决策信息系统,并详细分析了集值决策信息系统下基于相似关系的分布约简和最大分布约简,在此基础上,构造了一种基于可区分对象集的属性约简算法,算法利用可区分对象集的集对,计算极小析取范式求解出所有的分布约简和最大分布约简。最后,利用实例分析验证了算法的有效性。  相似文献   

7.
完备混合型信息系统下的粗糙集模型是传统粗糙集模型的重要扩展,目前关于非平衡数据属性约简的研究仅限于完备混合型的粗糙集模型。针对这一问题,提出一种基于不完备混合型信息系统的非平衡数据属性约简。本文首先将传统的粗糙集模型进行推广,提出不完备混合型信息系统下的粗糙集模型;然后针对数据的非平衡性,根据上下边界区域和类分布的不均匀性定义了一种新的属性重要度;在基于区别矩阵的基础上设计出一种非平衡数据的属性约简算法。实验分析表明该算法针对不完备非平衡数据的属性约简具有一定的有效性和优越性。  相似文献   

8.
广义邻域关系下不完备混合决策系统的约简   总被引:1,自引:0,他引:1  
为了能够直接处理不完备的、数值和符号混合的数据,对相容关系和相对邻域关系进行广义化表示,提出一种新的广义邻域关系。在广义邻域关系下,基于信息熵提出一种适用于不完备混合决策系统的条件熵,并证明基于该条件熵的属性重要性包含基于正区域的属性重要性,进而构造基于该条件熵的启发式属性约简算法。采用UCI数据库中6组混合型属性数据集进行仿真实验,通过对比约简后的属性数目、分类精度和运行时间,验证了该约简算法比同类型的其它算法更准确有效。  相似文献   

9.
通过分析不完备信息系统中基于相容矩阵的属性约简算法,定义一个在单个条件属性下的新二进制相容矩阵,给出新矩阵间的吸收运算规则,利用该规则得到不完备信息系统条件属性集的二进制相容矩阵.通过判断新二进制相容矩阵间运算后得到的矩阵是否与条件属性集下的矩阵等价,找出不完备信息系统的属性约简.证明该属性约简与不完备信息系统中基于正...  相似文献   

10.
应用粗糙模糊度的不完备信息系统属性约简   总被引:1,自引:0,他引:1  
粗糙集理论能有效地处理不精确、不一致、不完整等不完全数据信息,可以对数据信息进行分析和推理,发掘隐含知识,揭示潜在规律.属性约简是粗糙集理论的重要研究课题.在现实生活中,由于各种条件限制,信息的不完备现象广泛存在,限制了经典Rough集理论在一些实际问题中的应用.文中引入粗糙模糊度度量,定义了一种新的知识熵.在此基础上,提出了一种基于信息观下粗糙模糊度的不完备信息系统属性约简算法.通过仿真实验说明了该算法的有效性和较好的时间优越性.  相似文献   

11.
信息系统的属性约简是粗糙集理论的重要内容之一。除正区域、差别矩阵、信息熵之外,运用模糊T的性质提出了一种基于t-范数的划分,基于知识的划分,给出了相似性的概念,提出了若干相似性的性质,并将该相似性的度量运用到属性约简中,给出了一个新的属性约简算法,从而对属性约简进行改进。通过一个数据模型的验证,新的算法同样可以有效地滤除冗余属性,保留关键属性,充分说明了该方法的可行性。  相似文献   

12.
基于系统熵的属性约简的简化差别矩阵方法*   总被引:2,自引:0,他引:2  
基于系统熵的属性约简是一种新型的属性约简。该模型由于同时考虑了条件属性集和决策属性集对决策表的分类能力,它是一种考虑较周全的属性约简模型。为设计高效的属性约简算法,首先引入简化差别矩阵, 同时给出了基于该简化差别矩阵的属性约简定义,并证明该定义与基于系统熵的属性约简定义等价;然后用简化差别矩阵设计了一个基于系统熵的完备属性约简算法;最后用实例说明了新算法。  相似文献   

13.
属性约简是一种重要的数据挖掘方法。为了对混合型信息系统达到更好的属性约简性能,提出一种邻域组合度量的启发式属性约简算法。邻域依赖度是构造混合信息系统属性约简的常用方法,根据粒计算的视角,在混合信息系统中提出邻域知识粒度用于评估属性的粒化能力。将邻域依赖度与邻域知识粒度进行结合,提出混合信息系统下的邻域组合度量,并将该度量方法作为启发式函数,提出一种属性约简算法。实验分析表明,该算法比混合信息系统的其他相关属性约简算法具有更高的约简性能。  相似文献   

14.
基于系统熵属性约简的差别矩阵方法   总被引:1,自引:0,他引:1       下载免费PDF全文
在已有的相对属性约简算法中,差别矩阵方法是一种设计属性约简的常用方法。基于系统熵的属性约简是一种新型的属性约简,对于这种属性约简,目前还没有差别矩阵方法去设计其属性约简算法。为此,首先构造了一种新的差别矩阵,同时给出了该差别矩阵的属性约简定义,然后证明了基于新差别矩阵的属性约简与基于系统熵的属性约简是等价的。最后用新差别矩阵设计了一个基于系统熵属性算法,并用实例说明了新算法。  相似文献   

15.
姚晟  徐风  吴照玉  陈菊  汪杰  王维 《控制与决策》2019,34(2):353-361
属性约简是粗糙集理论一项重要的应用,目前已广泛运用于机器学习和数据挖掘等领域,邻域粗糙集是粗糙集理论中处理连续型数据的一种重要方法.针对目前邻域粗糙集模型中属性约简存在的缺陷,构造一种基于邻域粗糙集的邻域粗糙熵模型,并基于此给出邻域粗糙联合熵、邻域粗糙条件熵和邻域粗糙互信息熵等概念.邻域粗糙互信息熵是评估属性集相关性的一种重要的方法,具有非单调性变化的特性,对此,提出一种基于邻域粗糙互信息熵的非单调性属性约简算法.实验分析表明,所提出算法不仅比目前已有的单调性属性约简算法具有更优越的属性约简结果,而且具有更高的约简效率.  相似文献   

16.
对医疗数据进行挖掘能够对现有病历数据库中的数据进行自动分析并且提供有价值的医学知识。针对信息系统S=(U,C∪D,f,V),提出一种精简条件属性集C的求核方法,然后在此基础上针对以下这个问题,即临床病历数据库中存在大量重复样本和冗余属性,从而影响医疗诊断的精度和速度这个问题,建立基于信息论的粗糙集理论模型和SQL语言之间的关系,提出了基于SQL语言的条件信息熵属性约简算法。仿真结果表明,该算法实现简单,运行效率高,使得基于SQL语言的条件信息熵属性约简算法实用性更强,为粗糙集理论更广泛地应用于具体医疗数据挖掘提供了一种方法。  相似文献   

17.
属性约简是机器学习等领域中常用的数据预处理方法。在基于粗糙集理论的属性约简算法中,大多是根据单一的方法来度量属性重要度。为了从多角度对属性达到更为优越的评估效果,首先在已有的模糊邻域粗糙集模型中定义属性依赖度度量,然后根据粒计算理论中知识粒度的概念,在模糊邻域粗糙集模型下提出了模糊邻域粒度度量。由于属性依赖度和知识粒度代表了不同视角的属性评估方法,因此将这两种方法结合起来用于信息系统的属性重要度评估,最后给出一种启发式属性约简算法。实验结果表明,所提出的算法具有较好的属性约简性能。  相似文献   

18.
不一致决策表信息熵约简与代数约简的核计算与转化   总被引:2,自引:2,他引:0  
对不一致决策表,信息熵约简与代数约简有时会得到不同的属性约简和核属性,当前的方法多为先将不一致决策表转化为一致决策表,再对后者寻求高效算法.本文基于等价差别矩阵具有相同的核属性和属性约简的思想,提出一种以条件属性等价类构造简化的代数约简差别矩阵,从差别矩阵内部进行比较与分析,发现只须将信息熵约简差别矩阵中由同时为矛盾对象所产生的可辩识属性集剔除,即可转化为简化的代数约简差别矩阵,从而得到将信息熵约简核属性转化为代数约简核属性的新方法,理论分析与数值算例都验证了其正确性.  相似文献   

19.
信息系统中的属性约简是粗糙集知识发现的一个重要步骤。致力于研究一个信息系统中的特征选择、删除冗余属性。新的算法从属性重要性出发,采用迭代特征选择的标准,使得选择特征属性集不断缩小,获得信息系统的约简。通过实验证明该方法可行,有效。  相似文献   

20.
Attribute reduction is an important research concept in rough set theory. Many attribute reduction algorithms were designed for the static information system in the past years. However, many real-world data are generated dynamically. Then a new dynamic attribute reduction algorithm based on a 0-1 integer programming is proposed to deal with the dynamic data in this paper. When multiple objects in the information system evolve over time, instead of treating the changed information table as a new one and finding the reduct again like rough set reduction algorithm does, the proposed algorithm just updates the original reduct. Therefore, its computational speed improves greatly. In addition, an approach of constraint preprocessing is also presented in this paper. Numerical experiments on twelve benchmark datasets testify the feasibility and validity of the proposed algorithm.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号