首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
属性约简是粗糙集理论研究的主要内容之一,正区域计算是多数属性约简算法的关键。为了减少正区域的计算时间,提出基于链表存储的正区域计算方法。将属性值相同的数据存储在链表同一结点对象中,收集过程中不断删除基数为1的子划分,通过降低样本数据的规模来减少计算耗时,加速属性约简。同时,给出不可区分对象对数定义,并以此度量属性重要性,设计一种高效的启发式属性约简方法。通过实例和实验与经典约简算法进行性能测试比较,结果证实该算法在时间和空间效果上切实有效、可行。  相似文献   

2.
以不完备决策表为研究对象,通过对冲突域的概念进行研究,给出在不完备决策表下的基于冲突域的属性约简的定义。证明该属性约简的定义与基于正区域的属性约简定义是等价的,同时设计一个在不完备决策表中的新的属性约简算法。该算法的时间复杂度为O(|K||C|2|U|),其中K=max{|TC(xi)|,xi∈U}。最后用实例说明该算法是有效的。  相似文献   

3.
垂直划分二进制可分辨矩阵的属性约简   总被引:1,自引:0,他引:1  
针对二进制可分辨矩阵属性约简方法在处理大数据集时的不足,首先给出两种二进制可分辨矩阵属性约简的定义,并证明这两个属性约简定义与正区域的属性约简定义是等价的;然后,给出对二进制可分辨矩阵按条件属性垂直划分后进行属性约简的方法;为了进一步降低空间开销,提出将垂直分解的二进制可分辨矩阵存于外部介质中,在约简过程中,仅将所需部分调入内存,由此设计启发式属性约简算法,其时间和空间复杂度的上界分别为 (∣ ∣∣ ∣2)和 (∣ ∣2);最后,理论分析和实验结果验证了该算法的正确性和高效性.  相似文献   

4.
基于区分对象对集的高效属性约简算法   总被引:5,自引:0,他引:5  
给出区分对象对集的定义和基于区分对象对集的属性约简的定义,证明该定义与基于正区域的属性约简定义等价.由于求区分对象对集时,要求出U/C,故设计一个高效的求U/C的算法,其时间复杂度降为O(| C | | U |).进而提出一个基于区分对象对集的高效属性约简算法,其时间和空间复杂度分别降为O(|C| | U |)+O(| C| | U/C|2)和O(| U |)+O(| U/C |2).用1实例说明该算法的高效性.  相似文献   

5.
基于系统熵的属性约简的简化差别矩阵方法*   总被引:2,自引:0,他引:2  
基于系统熵的属性约简是一种新型的属性约简。该模型由于同时考虑了条件属性集和决策属性集对决策表的分类能力,它是一种考虑较周全的属性约简模型。为设计高效的属性约简算法,首先引入简化差别矩阵, 同时给出了基于该简化差别矩阵的属性约简定义,并证明该定义与基于系统熵的属性约简定义等价;然后用简化差别矩阵设计了一个基于系统熵的完备属性约简算法;最后用实例说明了新算法。  相似文献   

6.
基于简化差别矩阵的完备属性约简算法   总被引:4,自引:0,他引:4  
由于基于老差别矩阵的属性约简的定义与基于正区域的属性约简的定义是不一致的,给出一个简化差别矩阵和相应的属性约简的定义,并证明了该定义与基于正区域的属性约简的定义是一致的。由于在简化差别矩阵中,要先求出IND(C),故设计了一个较好的求IND(C)的算法,其复杂度被降为O(|C‖U|)。在此基础上设计了一个完备属性约简算法,其时间复杂度和空间复杂度分别被降为max{O(|C|2(|U′pos‖U/C|)),O(|C‖U|)}和max{O(|U|),O(|C|(|U′pos‖U/C|))}。  相似文献   

7.
属性约简是粗糙集理论的重要研究内容.目前决策粗糙集的属性约简大多基于全局的决策类,并且都是采用单一的约简准则.针对这一问题,在决策粗糙集下提出一种特定类别属性约简算法.针对特定的决策类,给出一种属性约简的定义,在保证决策区域极大化的同时尽可能地降低决策区域划分时的代价;利用集成学习的方法设计出相应的启发式属性约简算法.通过在UCI数据集上与已有的算法进行实验比较,验证了该算法具有更高的属性约简性能.  相似文献   

8.
一种快速计算HU差别矩阵的属性约简算法   总被引:7,自引:0,他引:7  
在已有的基于HU差别矩阵的属性约简算法中,一般是以差别矩阵中的元素作为启发信息而设计的,其时间复杂度为O(|C|2|U|2).为降低该属性约简算法的时间复杂度, 首先引入简化决策表的定义,并设计了一个求简化决策表的算法,其时间复杂度为O(|C||U|).然后在简化决策表的基础上,定义了差别区域,并给出基于差别区域的属性约简定义,同时证明了基于差别区域的属性约简与基于差别矩阵的属性约简等价.在此基础上,以快速缩小简化决策表的搜索空间为目的,定义了一个新的、较为合理的、度量属性重要性的公式,并给出了它的递归计算方法,其时间复杂度为O(U/C|).最后以属性重要性为启发信息,设计了一个基于差别矩阵的快速属性约简算法,其时间复杂度降为max(O(|C||U|,O(|C|2|U/C|)),并用一个实例说明了新算法的高效性.理论分析与实验表明,新算法具有较好的扩展性.  相似文献   

9.
针对目前基于决策表的属性约简矩阵算法效率不理想的情况,首先引入了简化决策表的概念,有效剔除了决策表中大量重复冗余的对象,并给出了正区域模型下简化矩阵的构造,从而有效地缩小了求解属性约简的搜索空间;然后从理论上详细分析了基于简化矩阵的属性约简与基于正区域的属性约简是一致的,并给出了一种有效的属性重要性度量方法.为此,在简化矩阵的基础上设出了一种快速的属性约简矩阵算法,最后通过实例分析和实验对比说明了算法的有效性和可行性.  相似文献   

10.
属性约简是粗糙集理论的重要研究内容之一。在Pawlak粗糙集模型中,正区域大小随着属性增多而变大,呈现单调性。然而,在决策粗糙集模型中,概率正区域与属性集之间不具有单调性,从而产生各种属性约简定义。为此,深入研究了决策粗糙集属性约简问题,阐述了几种约简定义之间的关系,证明了保持局部最大概率正区域的约简具有较大的代价,指出了保持所有对象的正决策不变的约简呈现稳定性和存在属性核。  相似文献   

11.
鲍迪  张楠  童向荣  岳晓冬 《计算机应用》2019,39(8):2288-2296
实际应用中存在大量动态增加的区间型数据,若采用传统的非增量正域属性约简方法进行约简,则需要对更新后的区间值数据集的正域约简进行重新计算,导致属性约简的计算效率大大降低。针对上述问题,提出区间值决策表的正域增量属性约简方法。首先,给出区间值决策表正域约简的相关概念;然后,讨论并证明单增量和组增量的正域更新机制,提出区间值决策表的正域单增量和组增量属性约简算法;最后,通过8组UCI数据集进行实验。当8组数据集的数据量由60%增加至100%时,传统非增量属性约简算法在8组数据集中的约简耗时分别为36.59 s、72.35 s、69.83 s、154.29 s、80.66 s、1498.11 s、4124.14 s和809.65 s,单增量属性约简算法的约简耗时分别为19.05 s、46.54 s、26.98 s、26.12 s、34.02 s、1270.87 s、1598.78 s和408.65 s,组增量属性约简算法的约简耗时分别为6.39 s、15.66 s、3.44 s、15.06 s、8.02 s、167.12 s、180.88 s和61.04 s。实验结果表明,提出的区间值决策表的正域增量式属性约简算法具有高效性。  相似文献   

12.
增量式属性约简是目前粗糙集理论的重点研究内容。针对不完备混合型信息系统属性变化的情形,提出一种基于正区域方法的增量式属性约简算法。提出了不完备混合型信息系统下正区域的一种等价且高效的计算表达形式,利用这种计算形式分别构造了属性增加和属性减少时正区域地增量式更新,理论证明了其高效性,基于这种增量式更新设计出了相应的增量式属性约简算法。UCI数据集的实验分析表明所提出增量式算法具有一定的有效性和优越性。  相似文献   

13.
属性约简是粗糙集理论的核心内容之一。通过对多种约简方法进行比较,为了得到更好的结果,在传统基于属性依赖度的约简方法基础上,定义更精确的强化正域概念。通过对边界域的精确划分,得出各条件属性对决策属性的强化依赖度,并用自顶向下的启发式搜索算法得到约简结果。采用UCI标准数据集对基于强化正域约简方法REPR进行测试,约简数据后构建的决策树规模小,分类精度高。实验结果表明,相比于经典方法,REPR能更有效地对决策表进行属性约简。  相似文献   

14.
粗糙集理论是一种有效的信息处理工具,属性约简是粗糙集理论研究的一个核心内容.为了能够较为有效地获得不相容决策表较优的属性约简,在对文献[7]中属性约简算法分析的基础上,根据不相容决策表约简不改变决策表正域的原则,仅考虑相对差异比较表中与正域相关的实例对,同时结合属性重要性作为特征选取的启发式信息,提出了一种改进的启发式属性约简算法.该算法在不增加算法时间复杂度的前提下能够处理不相容决策表.最后,通过实例完整演示了该方法,表明该算法是有效的.  相似文献   

15.
李成  赵海琳 《测控技术》2018,37(11):50-54
属性约简是粗糙集理论在模式识别中一项重要的应用,传统的属性约简算法只适合处理静态的信息系统,而处理不断动态更新的信息系统面临着巨大的挑战。对于不完备信息系统,提出一种增量式的属性约简算法。在不完备信息系统下引入粗糙集理论中关于正区域的概念,针对不完备信息系统中属性增加的情形,提出了基于正区域的增量式属性约简算法。实验结果表明了所提出的增量式属性约简算法比非增量式的算法具有更高的效率,同时比其他同类型的算法具有更高的优越性。  相似文献   

16.
康猛  蒙祖强 《计算机应用》2022,42(2):449-456
基于区分矩阵的传统属性约简方法具有直观易理解的优点,但时间和空间复杂度都很高,当数据规模较大或条件属性较多时,会无法快速得到约简结果.为解决该问题,在区分关系的基础上构造了条件区分能力来进行属性选择,提出一种基于条件区分能力的属性约简算法.而为了进一步加快属性重要性的计算、提高约简效率,依据大数定律中频率的稳定性,通过...  相似文献   

17.
基于正域的属性约简算法是利用"下近似"思想,仅考虑被正确区分样本数的约简算法。借鉴"上近似"的思想,利用"邻域信息粒"的概念定义了区分对象集,探讨了其基本性质,并提出了基于区分对象集的属性重要度度量及启发式属性约简算法。该约简算法既考虑信息决策表的相对正域,也考虑以核属性为启发信息逐个增加条件属性时对边界域样本的影响。通过实例分析,说明了所提算法的可行性,并且以6个UCI标准数据集为实验对象,与基于正域的属性约简算法进行对比实验。实验结果说明,采用提出的约简算法得到的约简属性集,与基于正域的属性约简算法相比,在进行分类任务时的分类精度能够保持不变或有所提高。  相似文献   

18.
粗糙集理论是一种有效的信息处理工具,属性约简是粗糙集理论研究的一个核心内容。为了能够较为有效地获得不相容决策表较优的属性约简,在对文献[7]中属性约简算法分析的基础上,根据不相容决策表约简不改变决策表正域的原则,仅考虑相对差异比较表中与正域相关的实例对,同时结合属性重要性作为特征选取的启发式信息,提出了一种改进的启发式属性约简算法。该算法在不增加算法时间复杂度的前提下能够处理不相容决策表。最后,通过实例完整演示了该方法,表明该算法是有效的。  相似文献   

19.
为解决信息系统在条件属性动态增加情况下的核属性更新问题,通过深入分析得到了一种二进制区分矩阵的等价表示方法;分析了新增条件属性对正区域和二进制区分矩阵的影响,得到一种正区域增量式计算方法,基于此提出了一种条件属性递增系统的核属性动态更新算法,该算法对已有二进制区分矩阵进行局部更新得到新的二进制区分矩阵,从而更新核属性,避免了重新计算,提高了运算速度。理论分析和实例结果验证了算法的有效性和可行性。  相似文献   

20.
遗传算法适合复杂问题的处理因此可用于属性约简的求解.目前利用遗传算法进行属性约简的主要不足是:适应度函数计算复杂,效率不高.尤其在处理大型决策表时,计算时间将大量聚集在适应度函数的计算上,从而导致算法性能下降.为了更快的计算适应度函数,在研究基于正区域的区分对象对集的基础上,设计了一种计算适应度函数的快速方法.利用启发信息设计了一种快速的属性约简遗传算法.通过实例分析和算法实验表明该算法能够高效求出决策表的属性约简并且适合处理大型决策表.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号