共查询到20条相似文献,搜索用时 140 毫秒
1.
《计算机应用与软件》2016,(5)
粗糙集理论的布尔矩阵表示形式具有直观、易于理解的优点,它的引入为研究粗糙集的理论提供了一个新的思路。在对布尔矩阵性质研究的基础上,针对已有的基于布尔矩阵算法没有考虑到核属性在浓缩布尔矩阵时的重要性的不足,将属性重要性与改进的条件区分能力相结合,提出基于核与改进的条件区分能力的属性约简算法,借助反向删除确保约简集的完备性。实例表明改进后的算法在条件区分能力上更加准确,并且使约简结果更具有较强的完备性。 相似文献
2.
3.
基于区分能力的HU差别矩阵属性约简算法 总被引:2,自引:0,他引:2
将决策表属性区分能力大小与HU差别矩阵结合起来,建立起属性区别能力与该属性在HU差别矩阵中出现次数之间的关系.提出与HU差别矩阵属性约简相适应,只依赖于等价类基数计算的属性区分能力计算公式,得到HU差别矩阵约简的属性区分能力判定定理.定义了以属性区分能力为基础的属性相对重要性概念,提出以相对重要性为启发式信息的HU属性约简算法.由于该算法不必构造差别矩阵,只依赖于等价类基数的计算,从而大大提高了算法效率.数值算例和实验结果表明,该算法更有利于最优或次优约简结果的搜索. 相似文献
4.
一种基于知识量的约简算法 总被引:1,自引:0,他引:1
提出一种新的属性约简算法,该算法基于粗糙集理论认为知识是区分事物的能力的观点,对知识进行了新的量化,并以量化后的区分能力作为启发式信息进行约简,提高了约简效率,理论分析与实例证明该算法是有效的. 相似文献
5.
6.
7.
传统的属性约简方法将整个数据集一次性装入内存,很难适应大数据背景下的数据分析。为此文中提出基于粒计算与区分能力的属性约简算法。该算法运用统计学中的分层抽样技术,拆分原始大数据集为多个样本子集(粒),在每个粒上运用属性的区分能力进行属性约简,最后将各粒约简结果进行加权融合,得到原始大数据集的属性约简结果。实验表明该算法对海量数据集进行属性约简的可行性和高效性。 相似文献
8.
在对区分能力大小研究的基础上建立了一个用于指导信息表的绝对属性约简的粗糙集模型, 同时在对区分能力和分类能力二者关系深入研究的基础上提出了决策依赖区分精度新概念,该概念是用于指导决策表的、相对属性约简的一个新的判据.借助粗糙属性向量树提出了新的求全部属性约简的算法, 通过理论分析说明了新算法的最坏时间复杂度低于经典的"基于差别矩阵求全部属性约简算法"以及它的改进算法.对比实验结果验证了该算法在运算效率上明显高于"基于差别矩阵求全部属性约简算法"的改进算法. 相似文献
9.
在保持知识库分类能力不变的条件下,为了获得决策系统中属性的最小约简,本文利用遗传算法在全局寻优、避免算法陷入局部收敛方面的优势,结合区分矩阵能够很容易地计算出属性约简和核的良好性质,提出了一种基于遗传算法和区分矩阵的属性约简算法。该算法将区分矩阵嵌入遗传算法中,充分发挥各自在求解最小属性约简方面的优良特性,其中遗传算法主要流程基本不变,适应值函数选取引入区分矩阵的性质。实验结果表明,在可接受的时间内得到了最小约简,约简结果优于HU算法和传统遗传算法,达到了预期的结果。 相似文献
10.
11.
文献[6]给出的基于简化二进制可分辨矩阵的快速属性约简算法是不完备的,并且在处理大数据集时的效率不很理想.提出一种基于二进制有序差别集的属性约简算法,该算法不需要创建二进制可分辨矩阵,减少了数据处理量,大大提高了约简的效率,使算法的时间复杂度和空间复杂度分别降为max{O(|C|2|U/C|2),O(|C|2|BMsCount|)}和O(|BMsCount |).最后的实验结果表明该算法是正确的、高效的. 相似文献
12.
为了获得决策系统中更好的相对属性约简,本文提出了一种基于差别矩阵的启发式属性约简算法。该算法以求差别矩阵为基础,不仅考虑了所选择条件属性与决策属性的互信 息,还考虑了其取值的分布情况,从信息论角度定义了一种新的属性重要性度量方法,将其作为启发式信息,最终求得属性约简集。实例表明,算法能够有效地对决策系统进进行约简,获得比较理想的约简结果,同时约简后的决策规则数目较少。 相似文献
13.
基于可分辨矩阵的属性约简算法需要占用大量的存储空间,可分辨矩阵中许多元素项对约简是多余的;并且随着问题规模的增大,该类算法的效率并不理想。针对上述不足,提出一种基于有序差别集的属性约简算法,该算法不需要创建可分辨矩阵和生成多余的元素项,大大降低了存储量和计算量,从而提高了属性约简效率,使算法的时间复杂度和空间复杂度分别降为max{O(|C|2 |U/C|2),O(|C|2|MsCount|)}和O(|MsCount|)。实验表明该算法是有效的、高效的。 相似文献
14.
为了解决基于差别矩阵属性约简的计算效率问题,分析了基于差别矩阵的属性约简算法的不足,给出了新的差别矩阵的定义,大大减少了差别矩阵中非空元素的个数,提高了属性约简算法的效率。利用单个属性的不可辨识性来计算出现频率最多的属性,进一步降低差别矩阵的大小,并设计了基于新的差别矩阵的快速属性约简算法。对UCI一些数据库进行了仿真,实验结果表明了新算法具有高效性。 相似文献
15.
通过具体算例指出基于同可区分度属性约简不是王国胤等提出的条件信息熵约简。理论上证明了基于同可区分度属性约简仅是基于差别矩阵的HU属性约简,它是一种基于梁吉业等提出的新条件信息熵属性约简。证明了同可区分度约简协调集一定是代数协调集和信息熵协调集,从而代数约简核属性和信息熵核属性一定是同可区分度约简核属性的子集。 相似文献
16.
改进的基于简化二进制分辨矩阵的属性约简方法 总被引:1,自引:0,他引:1
在基于二进制分辨矩阵的属性约简方法中,删除法即从属性全集中依次删除冗余属性,直至剩余的属性集是一个最小约简.针对传统的基于二进制分辨矩阵的删除法效率较低且得不到最小约简的问题,提出一种改进的二进制分辨矩阵属性约简方法.首先对决策表进行简化,然后给出一种改进的简化二进制分辨矩阵方法;其次通过一个新的属性约简度量方法一次性删除多个属性,并从理论上分析了该方法的可行性;最后通过实验证明了得到的约简结果是最小约简. 相似文献
17.
一种粗糙集属性约简算法 总被引:15,自引:5,他引:15
该文针对RoughSet理论的属性约简进行了研究。利用RoughSet和信息论的相关知识,研究了通过可辨识矩阵求得属性约简集,并利用条件熵来计算属性约简集中属性间的相关性,其平均值最小的属性集即为求得的最佳属性约简的结果。实验证明,它可以取得比较理想的效果。最后利用该文的方法给出了对UCI机器学习数据库的例子的约简结果。 相似文献
18.
为了解决基于差别矩阵属性约简的计算效率问题,首先以计数排序的思想设计了一个新的计算U/C的高效算法,其时间复杂度降为O(|C||U|)。其次分析了基于差别矩阵的属性约简算法的不足,提出了改进的差别矩阵的定义,利用快速计算核属性算法生成的核属性和出现频率最多的属性来降低差别矩阵的大小,并设计了基于改进的差别矩阵的快速属性约简算法,证明了该新算法的时间复杂度和空间复杂度分别被降为max(O|C|2Σ0≤i相似文献
19.
20.
基于粗糙集和信息增益的属性约简改进方法 总被引:2,自引:0,他引:2
针对属性过多对于有效的数据挖掘很不利以及约简中差别矩阵的产生会占用较大存储空间的问题,提出了一种基于粗糙集和信息增益的属性约简改进算法.该算法首先采用信息增益技术对决策表属性进行相关分析,删除部分冗余属性,减小属性约简的复杂度,然后直接从决策表中提取出分明函数,求出属性约简.由于避免了分明矩阵的生成,因此该算法不仅节约了时间和空间,而且提高了效率. 相似文献