首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
鲍迪  张楠  童向荣  岳晓冬 《计算机应用》2019,39(8):2288-2296
实际应用中存在大量动态增加的区间型数据,若采用传统的非增量正域属性约简方法进行约简,则需要对更新后的区间值数据集的正域约简进行重新计算,导致属性约简的计算效率大大降低。针对上述问题,提出区间值决策表的正域增量属性约简方法。首先,给出区间值决策表正域约简的相关概念;然后,讨论并证明单增量和组增量的正域更新机制,提出区间值决策表的正域单增量和组增量属性约简算法;最后,通过8组UCI数据集进行实验。当8组数据集的数据量由60%增加至100%时,传统非增量属性约简算法在8组数据集中的约简耗时分别为36.59 s、72.35 s、69.83 s、154.29 s、80.66 s、1498.11 s、4124.14 s和809.65 s,单增量属性约简算法的约简耗时分别为19.05 s、46.54 s、26.98 s、26.12 s、34.02 s、1270.87 s、1598.78 s和408.65 s,组增量属性约简算法的约简耗时分别为6.39 s、15.66 s、3.44 s、15.06 s、8.02 s、167.12 s、180.88 s和61.04 s。实验结果表明,提出的区间值决策表的正域增量式属性约简算法具有高效性。  相似文献   

2.
决策表属性约简集的增量式更新算法   总被引:2,自引:0,他引:2  
针对动态变化的决策表,研究了属性约简集的动态更新问题。在详细分析新增对象的所有可能情况的基础上,提出一种基于分辨矩阵元素集的属性约简集增量式更新算法。该算法根据新增对象的不同情况快速更新分辨矩阵元素集,依据分辨矩阵元素集中增加和减少的元素有效地更新原属性约简集,快速得到新的最小属性约简。最后,通过5个UCI的数据集验证了算法的有效性。  相似文献   

3.
基于正区域的属性约简是目前最常用的一类约简算法。现实中的决策表有可能存在不一致的对象。另外,在约简过程中随着属性个数的减少,也有可能产生新的不一致对象。对于基于正区域的约简算法来说,不一致的对象并没有提供任何有用的信息,删除不一致的对象不会改变正区域的计算结果以及最终的约简结果,而且可以显著提高算法的效率。然而现有的基于正区域的约简算法并没有考虑到这个问题,它们采用论域中的所有对象来计算正区域并得出约简结果。针对这一问题,定义了重构相容决策表和重构相容决策子表的概念。引入这两个概念的目的是在约简过程中删除初始决策表中的不一致对象,从而获得一个相容决策表。借助于这两个概念,提出了一种新的基于正区域的属性约简算法。在真实数据集上的实验表明,与传统的算法相比,该算法能够获得较小的约简结果和较高的分类精度,并且具有相对较低的时间复杂度。  相似文献   

4.

提出一种新的约简算法. 首先以全局等价类为最小计算粒度, 提出粗等价类概念, 深入研究其性质并证明粗等价类下求核和约简与原决策系统等价; 剖析3 类粗等价类与正区域间的内在关联, 设计针对1 和??1 两类粗等价类双边删减下正区域的渐增式等价计算方法, 从而设计双向剪枝策略以及多次Hash 的属性增量划分算法, 基于此给出高效完备的约简算法. 最后用UCI 中20 个决策集、海量、超高维3 类数据集从多个角度进行验证, 结果表明, 所提出的约简算法的完备性和高效性在绝大多数情况下优于现有算法, 尤其适用于海量数据和超高维数据集.

  相似文献   

5.
Many real data sets in databases may vary dynamically. With such data sets, one has to run a knowledge acquisition algorithm repeatedly in order to acquire new knowledge. This is a very time-consuming process. To overcome this deficiency, several approaches have been developed to deal with dynamic databases. They mainly address knowledge updating from three aspects: the expansion of data, the increasing number of attributes and the variation of data values. This paper focuses on attribute reduction for data sets with dynamically varying data values. Information entropy is a common measure of uncertainty and has been widely used to construct attribute reduction algorithms. Based on three representative entropies, this paper develops an attribute reduction algorithm for data sets with dynamically varying data values. When a part of data in a given data set is replaced by some new data, compared with the classic reduction algorithms based on the three entropies, the developed algorithm can find a new reduct in a much shorter time. Experiments on six data sets downloaded from UCI show that the algorithm is effective and efficient.  相似文献   

6.
现实生活中许多数据库都是动态变化的,为了获取新的知识,传统的方法需要重复计算,耗时巨大。为了克服这个缺陷,有效处理动态数据,许多学者提出了增量学习方法。针对决策表属性值动态变化,提出了基于属性值细化的矩阵增量约简算法,当一部分属性值被细化时,同非增量约简方法相比,增量方法能快速找到新的约简,最后通过UCI数据进行性能测试,实验仿真结果表明所提增量约简算法是有效的。  相似文献   

7.
决策表中大量的不相容对象和相同对象会降低粗集约简算法性能,出现错误的属性核和约简结果。因此文中首先讨论决策表的不相容对象与相同对象即冗余对象对约简结果的影响,然后提出利用对象频度概念来删除冗余对象,组建最简决策表的算法。把求最简决策表的算法与高学东的粗集约简算法结合起来,形成了一种具有较好的处理不相容决策表、决策规则较合理的粗集约简算法。实例证明,该算法性能时间与空间复杂度与高学东算法相同,但明显优于Hu Xi-aoHua、叶东毅等的算法。  相似文献   

8.
粗糙集是一种处理不确定、不完全知识的数学工具,属性约简是粗糙集理论的重要研究内容之一。提出了一种基于条件熵的快速增量约简方法,主要分析了在对象动态增加情况下信息熵的变化机制。该算法通过判断更新前决策表的约简属性对新增对象的区分情况来计算新的条件熵值,就可以快速求解出更新后的决策表的属性约简结果。实验结果也进一步验证了该方法的有效性。  相似文献   

9.
Pawlak粗糙集的知识约简包括对决策表的知识约简和对信息表的知识约简。作为Pawlak粗糙集的扩展,邻域粗糙集在针对决策表的属性约简方面应用广泛,而针对信息表的属性约简方面应用鲜少。为了设计一种适用于信息表的属性约简算法,根据Pawlak粗糙集的信息表知识约简标准,首先提出一种邻域粗糙集的信息表知识约简标准,然后根据这种标准,结合贪心思想,进一步提出了一种适用于聚类任务的信息表属性约简算法。与主成分分析(principal component analysis,PCA)算法相比,实验结果表明用该算法对数据集降维后,得到的属性约简集合的属性个数较多,K-means算法根据属性集合进行聚类的精度较高。实验结果证明该算法能有效地应用于信息表的属性约简方面。  相似文献   

10.
在粗糙集理论中,属性约简是重要的研究内容之一。通过属性约简可以去除冗余属性,求得保持决策系统某种分类能力不变的最小属性子集。分布约简保持决策系统中所有决策类的分布不变,但针对所有决策类的分布约简在实际问题中可能是不必要的。针对以上问题,文中给出了区间值决策系统中基于α-相容关系的特定类分布约简的概念,证明了特定类分布约简的相关定理,构造了特定类分布约简对应的差别矩阵,提出了基于差别矩阵的特定类的分布约简算法(CDRDM),并分析了特定类的分布约简算法和全局分布约简算法(DRDM)构造的差别矩阵中非空元素的集合之间的关系。实验中选取了6组UCI数据集,引入了区间参数,当区间参数为1.2、阈值为0.5时,比较了DRDM算法和3种不同决策类下的CDRDM算法的约简结果和平均约简长度,并且当区间参数分别为1.2和1.6、阈值分别为0.4和0.5时,给出了DRDM算法和两种不同决策类下的CDRDM算法的约简时间随着对象数目和属性数目的变化情况。实验结果表明,特定类分布约简算法针对不同决策类的约简结果可能不同,并且当决策系统中的决策类数量大于1时,特定类分布约简算法的平均约简长度小于或等于全局分布约简算法的平均约简长度,特定类分布约简算法针对不同的决策类在约简效率上有不同程度的改进。  相似文献   

11.
在不一致决策表中,以知识的包含度为基础,将一致和不一致对象分开,定义了一种新的属性重要性;为克服区分矩阵法时间复杂度随系统大小增加而指数增长的缺陷,给出分布约简的数学判定定理,提出了一种求分布约简的启发式方法。实例验证分析表明,新的属性重要性是一种更有效的启发式信息,该方法时间复杂度较低,有助于搜索最小或次优约简。  相似文献   

12.
基于决策表的区分矩阵增量属性约简算法   总被引:1,自引:0,他引:1  
张长胜 《计算机工程与应用》2012,48(35):110-113,117
对于决策表中存在对象动态变化的现象,当利用静态的属性约简算法处理这类决策表时算法效率并不理想,为了有效提高增量属性约简算法的效率,对决策表进行了简化,并证明了基于简化区分矩阵的属性约简与基于区分矩阵的属性约简是一致的,在利用原的属性约简的基础上,提出了一种基于决策表的区分矩阵增量属性约简算法,通过实例分析说明算法的有效性和可行性。  相似文献   

13.
一种新的完全决策表属性约简的高效算法   总被引:2,自引:2,他引:2  
属性约简是粗糙集理论的核心问题之一,也是粗糙集有效算法研究的焦点。为获得最简明的规则集,通常希望能找出最小的属性约简集,但得到最优解是NP-hard的问题,通常采取启发式的算法得到近似最优解。文中研究了不完全决策表的属性约简,提出一种衡量不完全决策表属性重要性的标准,依此给出了一种新的进行属性约简启发式算法。对寻找对象的相似类的步骤则在排序和二分查找的基础上提出了一种新的高效的算法,这样就相应地使得属性约简的效率得到提高。此算法较好地解决了不完全决策表的属性约简问题。  相似文献   

14.
曾小宁  肖水晶 《计算机应用》2007,27(6):1403-1406
引入扩展差别矩阵和扩展决策矩阵,提出了新的属性约简算法和增量更新算法,即基于扩展差别矩阵的属性约简算法和基于扩展决策矩阵的增量式规则提取算法,讨论了规则的增量更新算法。由于使用了增量更新算法和并行处理技术,从而提高了数据挖掘的效率,降低了时间复杂度。通过实验说明此算法是有效和可行的。  相似文献   

15.
一种基于决策矩阵的属性约简及规则提取算法   总被引:17,自引:1,他引:16  
研究了Rough集理论中属性约简和值约简问题,扩展了决策矩阵的定义,提出了一种基于决策矩阵的完备属性约简算法,该算法利用决策属性把论域划分成多个等价类,然后利用每个等价类对应的决策矩阵计算属性约简。与区分矩阵相比,采用决策矩阵可以有效地减少存储空间,提高约简算法效率。同时,借助决策矩阵进行值约简,提出了一种新的规则提取算法,使最终得到的决策规则更加简洁。实验结果表明,本文提出的属性约简和值约简算法是正确、有效、可行的。  相似文献   

16.
粗糙集理论是一种有效的信息处理工具,属性约简是粗糙集理论研究的一个核心内容.为了能够较为有效地获得不相容决策表较优的属性约简,在对文献[7]中属性约简算法分析的基础上,根据不相容决策表约简不改变决策表正域的原则,仅考虑相对差异比较表中与正域相关的实例对,同时结合属性重要性作为特征选取的启发式信息,提出了一种改进的启发式属性约简算法.该算法在不增加算法时间复杂度的前提下能够处理不相容决策表.最后,通过实例完整演示了该方法,表明该算法是有效的.  相似文献   

17.
粗糙集理论是一种有效的信息处理工具,属性约简是粗糙集理论研究的一个核心内容。为了能够较为有效地获得不相容决策表较优的属性约简,在对文献[7]中属性约简算法分析的基础上,根据不相容决策表约简不改变决策表正域的原则,仅考虑相对差异比较表中与正域相关的实例对,同时结合属性重要性作为特征选取的启发式信息,提出了一种改进的启发式属性约简算法。该算法在不增加算法时间复杂度的前提下能够处理不相容决策表。最后,通过实例完整演示了该方法,表明该算法是有效的。  相似文献   

18.
传感器技术发展促进各行各业产生了大量多源数据,且这些数据还在不断发生变化.当多源数据(分布信息系统)增加了一些属性后,传统约简算法需要重复计算数据且不能有效实现多源数据融合,导致计算动态多源数据约简花费时间较多,计算效率不高.为了克服传统约简算法的缺陷,设计了基于多源数据矩阵增量约简算法.介绍了一些分布信息系统的相关理...  相似文献   

19.
由于数据随时间和空间不断更新,很多基于粗糙集的增量方法被提出。然而,动态数据上基于模糊粗糙集的特征选取(也称属性约简)更新的研究较少,特别是连续型动态数据上的增量特征选取。为了解决这个问题,提出适用于连续型数据的基于模糊粗糙集的增量属性约简算法。首先提出模糊粗糙基本概念的增量机制,如模糊正域的增量机制。只有部分示例在已有属性约简上的辨识能力不足,即对于模糊正域来说,存在一个关键示例集。增量约简算法基于已有数据上的约简结果,仅需要更新关键示例集中的示例,而非全部的论域。因而该增量算法在动态数据上能快速获得约简的更新。通过数值对比实验可以看出,增量算法比非增量算法在运行时间上有明显的优势。特别是对于高维数据集,增量算法可以大大地节省计算时间。  相似文献   

20.
属性约简是Rough集理论的核心内容之一,计算所有的属性约简已经被证明是NP完全问题.在深入研究Rough集理论的基础上,仔细分析了对象集的增加与属性约简的关系,给出了增量式属性约简的判定定理,从而提供了计算所有属性约简的增量式算法,分析了算法的时间复杂度.理论分析和实验结果表明,该约简算法在效率上较现有的算法有显著提高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号