首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
数据挖掘是一种重要的数据分析方法,决策树是数据挖掘中的一种主要技术,如何构造出最优决策树是许多研究者关心的问题。本文通过Rough集方法对决策表进行属性约简和属性值约简,去除决策表中与决策无关的冗余信息。在简化的决策表基础上构造近似最优决策树,本文给出了近似最优决策树的生成算法,并通过实例说明。  相似文献   

2.
基于Rough集的数据挖掘模型研究   总被引:13,自引:0,他引:13  
这项工作的主要目的是表明怎样能够有效地实现基于Rough集的数据挖掘技术,在这篇论文里,我们详细讨论了Rough集理论,为了从基于Rough集的数据库中发现新的规则,研究了一种适合数据挖掘的面向对象的软件系结构,给出了数据挖掘算法、规则发现算法和规则约简算法,从初始数据库的信息出发,依次建造差别矩阵、约简表和规则表,最后给出了一个模拟实例,表明我们的模型和算法是可行的。  相似文献   

3.
Rough集高效算法的研究   总被引:166,自引:11,他引:166  
深入分析了现有Rough集算法低效性的根源,围绕不可区分关系和正区域两个核心概念,研究了不可区分关系的性质,给出并证明了正区域的一种等价计算方法,从而得出高效的Rough集基本算法;随后,分析了正区域的渐增式计算,并给出了一种完备的同性约简算法.理论分析和实验结果表明,该约简算法在效率上较现有的算法有显著提高.  相似文献   

4.
5.
数据挖掘是一种重要的数据分析方法,决策树是数据挖掘中的一种主要技术,如何构造出最优决策树是许多研究者关心的问题。本文通过Rough集方法对决策表进行属性约简和属性值约简,去除决策表中与决策无关的冗余信息。在简化的决策表基础上构造近似最优决策树,本文给出了近似最优决策树的生成算法,并通过实例说明。  相似文献   

6.
通过分析分明矩阵方法进行属性约简时存在的一些弱点,本文提出了分明矩阵方法的简化,并将其应用于数据库中决策规则的提取。在求核集时,该方法不必生成分明矩阵这一环节,从而减少了时空上的不必要开销,提高了属性约简的效率,并通过一个实例详细地说明了具体提取过程,该实例说明了基于Rough集提取决策规则的方法简单易行。  相似文献   

7.
基于Rough集的数据约简算法研究综述   总被引:4,自引:0,他引:4  
介绍基于Rough集的数据约简的理论和它在应用理论研究上的新进展,综述基于Rough集的数据约简算法研究应用成果,并指出其应用前景和存在的问题。  相似文献   

8.
Rough集   总被引:12,自引:0,他引:12  
刘真 《计算机科学》1997,24(1):15-19
1993—94年我在美国Stanford大学和San Jose州立大学作高访学者时,与本文致谢中提到的T.Y.Lin教授合作研究Rough集理论及其应用,我们的工作曾在1994年11月美国举行的第三次Rough集和软计算国际学术会议上受到Z.Pawlak教授的赞扬。这一理论及其应用现已成立了国际性学术研讨会,参加的成员有波兰、加拿大、美国、日本、俄罗斯、乌克兰和印度等。每年或两年举行一次学术会议。国内也开始陆续发表Rough集方面的文章。在此,我们将“Rough集”译出,以飨读者。——刘清  相似文献   

9.
基于属性值重要性的Rough集值约简算法   总被引:1,自引:0,他引:1  
值约简是Rough集理论的一个重要研究课题。很多学者对它进行了研究并提出了不同的值约简算法,但是在执行效率上还有待提高。在启发式值约简算法基础上,结合属性值的重要性,提出了一种改进的基于属性值重要性的Rough集值约简算法,该算法在执行效率上有很大的提高,通过实例分析验证了该算法的可行性和有效性。  相似文献   

10.
值约简是Rough集理论的一个重要研究课题。很多学者对它进行了研究并提出了不同的值约简算法,但是在执行效率上还有待提高。在启发式值约简算法基础上,结合属性值的重要性,提出了一种改进的基于属性值重要性的Rough集值约简算法,该算法在执行效率上有很大的提高,通过实例分析验证了该算法的可行性和有效性。  相似文献   

11.
由于软件体系复杂度和数量不断增加使得测试用例的设计和选择越来越困难,为了能够在来自不同信息源的众多测试用例中选择有效的用例集,提出了一种基于粗糙集与证据理论的测试用例优化方法。粗糙集是一种处理不确定信息的有效方法,其本身不需要先验知识、有经典的约简算法等;D-S理论处理来自不同信息源的数据合成问题,是经典概率论的一种扩展,但其本身存在许多不足。粗糙集的特点恰好可以弥补其不足,两者结合从而达到良好的效果。在实际应用分析中,证明该方法是可行而且有效的。  相似文献   

12.
Autonomous clustering using rough set theory   总被引:1,自引:0,他引:1  
This paper proposes a clustering technique that minimizes the need for subjective human intervention and is based on elements of rough set theory (RST). The proposed algorithm is unified in its approach to clustering and makes use of both local and global data properties to obtain clustering solutions. It handles single-type and mixed attribute data sets with ease. The results from three data sets of single and mixed attribute types are used to illustrate the technique and establish its efficiency.  相似文献   

13.
馈线自动化系统是配电网系统的重要环节,本文从配电网系统及馈线自动化系统的分析出发,分析研究基于多Agent系统(MAS)网络式保护的FTU馈线自动化模式。馈线远方终端(FTU)的设计基于Agent技术,构成MAS,其基于粗糙集理论的故障判断模块能针对馈线的不同故障采取有效的保护措施实施馈线保护。在系统发生复杂故障或开关、保护存在较多误动、拒动以及因信道干扰而发生信息丢失等诸多不确定因素的情况下,也能够按决策规则表进行故障诊断,有效的提高系统的容错性。  相似文献   

14.
决策系统中连续属性离散化,即将一个连续属性分为若干属性区间并为每个区间确定一个离散型数值,对后继阶段的机器学习具有重要的意义。首先研究了满足决策系统最优划分的一种计算候选断点集合的算法,然后在基于条件属性重要度和贪心算法的基础上提出了一种确定结果断点子集的新启发式算法。所提出的属性离散算法考虑并体现了粗糙集理论的基本特点和优点,并能取得较理想的连续属性离散化结果。  相似文献   

15.
关联规则挖掘是数据挖掘的重要领域之一,利用粗糙集理论来挖掘关联规则的方法已经得到广泛关注.针对不完备信息系统,提出了基于粗糙集理论的快速ORD关联规则挖掘算法.该算法首先采用基于粗糙集理论的属性约简算法进行属性约简,然后采用快速、高效的冗余项集和冗余规则修剪算法--ORD算法获取关联规则.将该算法与其它同类流行的算法在4个UCI数据集上进行实验比较,结果表明该算法性能良好.  相似文献   

16.
一种基于粗集理论的动态近似规则挖掘推理方法   总被引:2,自引:0,他引:2  
提出一种基于粗集理论的,把属性的重要性和属性值的出现频率综合起来进行规则推理的方法.分析了“激活一个,否则离开”原则的优缺点,指出在近似推理中,大前提中的规则数量应该可变.给出一种根据推理过程中规则的出现频率决定其是否保留,从而实现规则数量的动态变化的方法,证明了动态变化过程中规则的数量不会无限增加.实例表明此法是比较有效的.  相似文献   

17.
粗糙集和神经网络方法在数据挖掘中的应用   总被引:2,自引:0,他引:2       下载免费PDF全文
提出了一种基于神经网络和粗集的数据挖掘新方法。首先利用粗集理论对原始数据进行一致性属性约简,然后使用神经网络对数据进行学习,并同时完成属性的不一致约简,最后再由粗集对神经网络中的知识进行规则抽取。该方法充分融合了粗集理论强大的属性约简、规则生成能力和神经网络优良的分类、容错能力。实验表明,该方法快速有效,生成规则简单准确,具有良好的鲁棒性。  相似文献   

18.
通过研究飞机快速存取记录器(Quick Access Recorders,QAR)数据和粗糙集理论的特点,结合信息决策表的相关知识,对QAR数据中的异常数据进行检测挖掘,以辅助飞机故障检测及排除。主要工作是:应用粗糙集理论特点对QAR数据进行离散化,并建立离散化后数据的决策表,然后对决策表进行属性约简和规则提取。根据QAR数据的特殊性,给出了数据离散化和决策表属性约简的改进算法。最后通过对比项目实验及专家给出的数据证明了其可行性和有效性,提高了飞机排故效率,具有很重要的现实意义。  相似文献   

19.
Classification and rule induction using rough set theory   总被引:3,自引:1,他引:2  
Rough set theory (RST) offers an interesting and novel approach both to the generation of rules for use in expert systems and to the traditional statistical task of classification. The method is based on a novel classification metric, implemented as upper and lower approximations of a set and more generally in terms of positive, negative and boundary regions. Classification accuracy, which may be set by the decision maker, is measured in terms of conditional probabilities for equivalence classes, and the method involves a search for subsets of attributes (called 'reducts') which do not require a loss of classification quality. To illustrate the technique, RST is employed within a state level comparison of education expenditure in the USA.  相似文献   

20.
介绍了一种基于统计分析的数据离散化方法——谱系聚类法,以胶合板缺陷检测数据为应用对象进行了基于谱系聚类的数据离散化研究,并与其它离散化方法进行了对比分析,对比结果表明经谱系聚类方法离散化后的数据,再进行粗糙集约简时,会有更多的冗余属性和记录被约掉,从而可以降低模型的复杂程度,加快获取知识的进程,提高分类的准确率。工程实践证明谱系聚类是一种有效的可用于数据预处理的离散化方法,结合粗糙集算法可以获取满意的数据挖掘结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号