首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 125 毫秒
1.
连续属性离散化是粗糙集理论的重要研究内容之一。将差别矩阵应用到连续属性离散化中,充分利用差别矩阵的优点,提出一种基于差别矩阵的粗糙集连续属性离散化算法。为使差别矩阵适应离散化应用中的需要,给出了粗糙集连续属性离散化中差别矩阵的定义。基于该差别矩阵,以候选断点在差别矩阵中的出现频率和断点重要性为启发式信息,对差别矩阵进行化简,直到该差别矩阵为空,即得到所求结果断点,以实现对决策表的离散化,并通过实例证明了该算法的高效性。  相似文献   

2.
赵晓霞 《现代电子技术》2007,30(22):197-199
粗糙集理论中,属性的离散化是预处理中的关键问题。基于新聚类学习算法提出了一种新的属性离散化方法,并将该方法用于车牌字符识别中。首先根据车牌字符的特征建立决策表,给出了基于新聚类学习算法对决策表属性值进行离散化的算法。然后应用粗糙集理论对离散后的决策表属性进行约简,由约简后的属性构造神经网络识别器。字符识别的结果分析表明基于新聚类学习方法的离散化算法对于车牌字符属性较为适用。  相似文献   

3.
提出了一种标准粗糙集约简时连续属性离散化的新方法.采用标准粗糙集进行属性约简时,要求属性为离散的,而大多数情况下属性是连续的,因此需要进行离散化处理.首先介绍了原有的信息熵算法并指出其局限性;其次,对多类别信息熵进行扩充,将距离因素引入到该信息熵的计算中;最后给出了扩展信息熵计算的两个基本准则,利用证据理论完成信度的上聚焦.仿真显示了该方法的有效性.  相似文献   

4.
遗传算法在决策系统离散化中的应用   总被引:9,自引:0,他引:9  
离散化在粗糙集的实际应用中有重要的意义,它使得粗糙集有更广泛的应用范围,粗糙集中的离散化要求在保持原来决策系统的不可分辩关系情况下,用尽量少的断点进行离散化,文章针对该问题提出了一种遗传算法,将最小断点集作为优化目标,同时兼顾一致性的要求,最后对实例进行了求解,证明该算法是有效的。  相似文献   

5.
连续数据离散化能够提高数据挖掘算法的分类能力.文中提出一种基于统计指标的连续属性离散化方法,凭借相关系数衡量类与属性间的关联度,获取最优区间列表.引入变精度粗糙集模型,有效地控制数据由离散化导致的信息丢失.该方法在声纳传感器数据识别以及其它领域上进行了应用.实验结果表明,该方法在J48决策树上有很好的分类能力.  相似文献   

6.
为解决粗糙集离散化过程中存在的信息损失问题,将粗糙集理论与模糊集理论相结合,提出基于FCM的模糊粗糙属性约简算法.该方法用模糊C均值聚类算法对连续属性进行模糊化,并通过有效性分析来确定最佳分类数目.该方法克服了目前属性模糊化方法需要人为规定划分类数.几乎不考虑信息系统的具体属性值等缺点.最后分别对天气信息系统和玻璃识别信息系统进行了属性约简计算,结果表明该方法是可行有效的.  相似文献   

7.
粗糙集理论是处理不完备、不确定信息的有效数学工具,是目前数据挖掘、知识工程应用中关键技术之一。粗糙集一般针对离散数据进行处理,实际应用中,数据库中大量存在连续或分散型数据,因此离散化步骤在粗糙集信息系统分析过程中具有重要意义。文章简介粗糙集相关基础知识,从不同角度对现有离散化方法进行了分类,介绍了典型的离散化方法,给出了后续研究思考。  相似文献   

8.
基于熵的粗糙集属性简约算法   总被引:5,自引:0,他引:5  
本文定义了四种条件熵,并在此基础上提出了四种基于熵的方法,以用于粗糙集数据分析中的属性简约。举例说明了这四种基于熵的属性简约算法各自的优缺点。最后对两个实际数据库进行了测试,结果表明了所提出的基于熵的属性简约算法的有效性。  相似文献   

9.
《现代电子技术》2016,(7):115-119
针对传统数据挖掘算法在数据量级方面的局限性,提出在粗糙集理论的基础上,采用类分布链表结构改进传统的基于属性重要性的数据离散化算法、属性约简算法以及基于启发式的值约简算法。讨论了基于动态聚类的两步离散化算法,当算法适应大数据处理之后,采用并行计算的方法提高算法的执行效率。算法测试结果表明,改进算法能有效地处理大数据量,同时并行计算解决了大数据量处理带来的效率问题。  相似文献   

10.
针对传统数据挖掘算法在数据量级方面的局限性,提出在粗糙集理论的基础上,采用类分布链表结构改进传统的基于属性重要性的数据离散化算法、属性约简算法以及基于启发式的值约简算法;讨论了基于动态聚类的两步离散化算法,当算法适应大数据处理之后,采用并行计算的方法提高算法的执行效率。算法测试结果表明改进的算法能有效地处理大数据量,同时并行计算解决了大数据量处理带来的效率问题。  相似文献   

11.
A Knowledge Reduction Algorithm Based on Conditional Entropy   总被引:1,自引:1,他引:0  
1 IntroductionSomeindustries ,includingtelecommunicationsandcreditcards ,haveinteractiverelationshipwithcustomersthatgeneratemanytransactionrecords,whichmakesdatatobegeneratedandcollectedatanunprecedentedspeed .However,thesedatahavetobeturnedintoknowledg…  相似文献   

12.
基于信息熵理论的连续属性离散化方法   总被引:1,自引:1,他引:0  
很多数据挖掘和机器学习方法仅仅依赖于离散值的属性,这样必须离散连续的属性.文中提出一种基于信息熵理论的数据离散化方法(IED),利用信息熵的思想衡量离散区间是否类似,同时考虑离散区间大小对离散化结果的影响,该方法综合考虑了离散区间与类之间的独立性.实验结果表明,IED显著地提高了Na ve-bayes分类学习精度.  相似文献   

13.
不完备信息系统中知识约简的一种启发式算法   总被引:6,自引:0,他引:6  
不完备信息系统中的知识获取是粗集理论应用的难点。通过引入信息熵和条件信息熵,对信息系统中属性的必要性进行了定义;提出了一种基于条件信息熵的知识约简启发式算法,并指出该算法的时间复杂度是多项式的。通过实例说明,该算法能得到信息表的约简和决策表的最小相对约简。  相似文献   

14.
一种基于属性重要度的值约简算法   总被引:1,自引:0,他引:1  
曹坤  柳炳祥  张仁宏 《信息技术》2005,29(8):110-112
值约简是粗糙集理论的一个重要研究课题,很多学者对它进行了研究并提出了不同的值约简算法,但由于值约简算法是NP—hard问题,目前还没有高效的值约简算法。文中利用信息熵来计算属性重要度,在此基础上对值约简算法进行改进,提出了一种基于属性重要度的值约简算法,并将此算法运用到变压器故障诊断中。实验结果验证了此算法的可行性和有效性。能节省循环比较时间,提高计算速度。  相似文献   

15.
Data discretization contributes much to the induction of classification rules or trees by machine learning methods. The rough set theory is a valid tool for discretizing continuous information systems. Herein, a new method is proposed to improve those typical rough set based heuristic algorithms for data discretization, by utilizing decision information to reduce the scales of candidate cuts, and by more reasonably measuring cut significance with a new conception of cut selection probability. Simulations demonstrate that compared with other typical discretization algorithms based on the rough set theory, the proposed method is more capable and valid to discretize continuous information systems. It can effectively improve the predictive accuracies of information systems while still conceptually keeping their consistency.  相似文献   

16.
决策表中基于条件信息熵的近似约简   总被引:2,自引:1,他引:2  
杨明 《电子学报》2007,35(11):2156-2160
属性约简是粗糙集理论的重要研究内容,已有效应用于机器学习、数据挖掘等领域.基于条件信息熵的属性约简可有效推广代数观下的属性约简,但存在抗噪声弱且某些情况下冗余属性多的不足.为此,本文在引入决策表中基于条件信息熵的近似约简概念后,提出决策表中基于条件信息熵的近似约简算法,该算法可有效增强抗噪性,且可依据实际应用的需要有效地对冗余属性进行取舍.最后,本文侧重通过选择不同精度下的约简属性子集在Benchmark上进行了分类器的性能测试.  相似文献   

17.
针对经典的粗糙集方法在处理不完备测试数据时,将完备化和属性约简先后进行易导致完备化数据产生偏差而影响属性约简准确性的问题,给出一种基于不完备熵的属性约简算法.通过对属性重要度概念在粗糙熵和不完备熵定义上进行拓展,立足原始测试数据直接计算各条件属性的属性重要度,从而获取一个较优的属性约简.该方法不仅充分考虑了不完备数据与属性约简之间的联系,而且约简结果更加精确,最后在某型装备故障诊断中应用验证了其有效性和优越性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号