共查询到19条相似文献,搜索用时 421 毫秒
1.
本文就粗糙集理论及其在数据挖掘中的应用方法进行了较为深入系统地研究。重点研究了扩展粗糙集模型;基于连续属性的粗糙集模型及其约简算法;不完备信息系统下粗糙集模型及其约简算法;以及更一般的集值信息系统及其约简算法。 相似文献
2.
3.
完备混合型信息系统下的粗糙集模型是传统粗糙集模型的重要扩展,目前关于非平衡数据属性约简的研究仅限于完备混合型的粗糙集模型。针对这一问题,提出一种基于不完备混合型信息系统的非平衡数据属性约简。本文首先将传统的粗糙集模型进行推广,提出不完备混合型信息系统下的粗糙集模型;然后针对数据的非平衡性,根据上下边界区域和类分布的不均匀性定义了一种新的属性重要度;在基于区别矩阵的基础上设计出一种非平衡数据的属性约简算法。实验分析表明该算法针对不完备非平衡数据的属性约简具有一定的有效性和优越性。 相似文献
4.
5.
6.
不完备决策表的一种知识约简算法* 总被引:4,自引:1,他引:3
知识约简是粗糙集理论的核心内容之一。介绍了不完备信息系统下的粗糙集模型,提出了一个在不完备决策表中利用属性的重要性进行知识约简的算法,并给出实例计算结果,证明了算法的可行性。 相似文献
7.
为拓展覆盖粗糙集模型,用多粒度方法研究了张燕兰等提出的广义覆盖决策信息系统模型,定义了多粒度意义下的覆盖上下近似,提出了多粒度属性约简算法。用实例对多粒度覆盖粗糙集属性约简方法和胡清华等提出的单粒度方法进行了比较。 相似文献
8.
聂林娣 《数字社区&智能家居》2009,(9)
数据挖掘是近年来数据库领域中出现的一个新兴研究热点,它是从大量数据中获取知识。进行数据挖掘的方法很多,粗糙集方法便是其中的主要方法之一。属性约简算法是基于粗糙集理论的数据挖掘模型中的关键步骤,同时也是粗糙集理论研究中的一个研究重点。通过对粗糙集理论的属性约简算法的深入研究,本文提出了一种改进的属性约简启发式算法。该算法建立在可辨识矩阵计算基础上。改进算法基于Hu的算法与Jelonek算法,在计算可辨识矩阵的基础上,保证最终能够找到决策信息系统的一个约简,同时较Jelonek算法相比,运算时间明显减少。 相似文献
9.
10.
决策粗糙集理论是经典粗糙集理论结合贝叶斯理论拓展而来。为在不完备区间值信息系统下研究决策粗糙集理论,本文首先提出属性相似度的概念,并基于属性相似度定义了双精度容差关系。然后,基于双精度容差关系,结合贝叶斯最小风险决策原则建立不完备区间值信息系统下决策粗糙集模型。针对该模型,对不确定性度量进行修正并基于修正的不确定性度量对该模型的属性约简进行研究。最后提出属性约简算法并应用于目标识别实例。 相似文献
11.
万金凤 《计算机工程与应用》2006,42(11):55-56
粗糙集是一种新型的处理模糊和不确定知识的数学工具。经典粗糙集理论是建立在完备信息系统基础上的,然而在实际中,不完备信息系统的广泛存在极大地限制了粗糙集理论的应用。文章利用粗集中的精度,结合信息粒度原理,对不完全信息系统利用序列套导出其粒度分层结构和基于相容关系的粗集逼近。 相似文献
12.
一种基于粗糙集的最小约简算法 总被引:4,自引:6,他引:4
随着计算机技术的发展,急剧产生海量的数据。如何从这些数据中提取有用的信息是一个重要的问题。一种新的数据分析方法——粗糙集理论被提出。该理论在分类的意义下定义了模糊性和不确定性的概念,是一种处理不确定和不精确问题的新型数学工具。文中首先对近年兴起的粗糙集的基本概念进行了叙述,在此基础上运用粗糙集理论提出一种新的约简算法。 相似文献
13.
粗糙集连续属性离散化模型研究与应用要点分析 总被引:10,自引:0,他引:10
基于粗糙集理论,研究连续属性离散化问题的本质特点,提出粗糙集指标衡量和优化算法结构相统一的离散化思想,设计通用的离散化方法模型。分析主流的SOM网络、GA、层次聚类、信息熵等主流聚类方法的特点,并基于这种结构模型,给出了相应离散化方法的应用要点。 相似文献
14.
经典的粗糙集理论是基于完备信息系统的,然而实际中由于种种原因会碰到不完备信息系统,论文给出了利用集对联系度定义不完备信息系统中集合的上、下近似集,在一定程度上将粗糙集用于不完备信息系统方面进行了推广。 相似文献
15.
针对ID3算法构造决策树复杂、分类效率不高等问题,本文基于变精度粗糙集模型提出了一种新的决策树构造算法。该算法采用加权分类粗糙度作为节点选择属性的启发函数,与信息增益相比,该标准更能够全面地刻画属性分类的综合贡献能力,计算简单,并且可以消除噪声数据对选择属性和生成叶节点的影响。实验结果证明,本算法构造的决策树在规模与分类效率上均优于ID3算法。 相似文献
16.
17.
18.
《Knowledge》2007,20(8):695-702
This paper presents a new approach for inducing decision trees based on Variable Precision Rough Set Model. The presented approach is aimed at handling uncertain information during the process of inducing decision trees and generalizes the rough set based approach to decision tree construction by allowing some extent misclassification when classifying objects. In the paper, two concepts, i.e. variable precision explicit region, variable precision implicit region, and the process for inducing decision trees are introduced. The authors discuss the differences between the rough set based approaches and the fundamental entropy based method. The comparison between the presented approach and the rough set based approach and the fundamental entropy based method on some data sets from the UCI Machine Learning Repository is also reported. 相似文献
19.
针对已有多粒度粗糙集粒度约简算法效率较低的问题,提出一种多粒度粗糙集粒度约简的高效算法(EAGRMRS)。首先,以决策信息系统为对象,定义决策类下近似布尔矩阵,该矩阵能够将粒度约简过程中过多且有重复的集合运算转换为布尔运算,基于该矩阵给出计算决策类下近似算法和计算粒度重要度算法。然后,针对计算粒度重要度时存在冗余计算的问题,提出粒度动态增加时快速计算粒度重要度的算法,并在此基础上,提出EAGRMRS,该算法的时间复杂度为O(|A|·|U|2+|A|2·|U|),其中|A|表示粒度集合大小,|U|表示决策信息系统中实例数。在UCI数据集上的实验结果验证了所提算法的有效性和高效性,并且随着数据集的增大,EAGRMRS相较于多粒度粗糙集粒度约简的启发式算法(HAGSS)效率优势更加明显。 相似文献