首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 338 毫秒
1.
定义离散化方案之间的偏序关系以及交、并运算,将一个信息表的各种离散化方案组织成一个格空间,称为离散格.分析了离散格与划分格之间的关系,证明了离散格是一个布尔代数,而划分格不是布尔代数.分析了一类离散化算法,指出这类算法的求解过程正是对离散格的搜索过程.  相似文献   

2.
提出对象域U的有序划分概念,讨论一种特殊的离散化方案(闭离散化方案)。给出对象域U的有序划分对应的闭离散化方案获取算法CDA,分析闭离散化方案与对象域U的有序划分之间的关系,证明了闭离散化方案在离散格到划分格的映射f下能保持交并运算。  相似文献   

3.
在文献[1]的基础上,得到了离散格的表示定理.进一步证明了在离散格到划分格的映射下交运算可以保持运算,而并运算不能保持运算,因此该映射不是同态映射.根据离散化后得到的对象域划分定义了离散化方案之间的等价关系,证明了随着离散化等价类[DR]的加粗,离散化方案对应的正区域下降,而条件信息熵上升.最后分析了另外两种离散格搜索算法.  相似文献   

4.
基于遗传算法的Bayesian网中连续变量离散化的研究   总被引:5,自引:1,他引:5  
文中如何从含有离散变量和连续变量的混合数据中学习Bayesian网进行了研究,提出了一种基于遗传算法的连续变量散化算法,在该处中给出了兼顾离散模型准确度和复杂度的适应度函数;并基于对离散化的实质性分析,定义了离散策略等价的概念,由此制定了离散策略的编码方案;进一步设计了变换离散策略的遗传算法。算法不存在局部极值问题,且不需要事先给定变量序关系,模拟实验结果表明,该算法能有效地对连续变量散化,从而使得从混合数据中学到的Bayesian网具有较好性能。  相似文献   

5.
一种新的用于连续值属性离散化的约简算法   总被引:4,自引:0,他引:4  
针对在Nguyen和Skowron的离散化算法中进行启发式约简时会出现某些属性不能进行离散化问题,以及在无核数据集中启发式约简算法计算量比较大等问题,在粗糙集理论和属性频率函数的基础上给出一个新概念-候选核,并提出一种新的用于连续值属性离散化的约简算法-基于候选核的启发式约简算法(简称BCC)。该算法可以寻找到能对所有属性进行离散化的约简,实验表明,所提出的BCC算法能提高大数据集的离散化效果。  相似文献   

6.
皋军  王建东 《计算机应用》2004,24(2):135-137
在数据挖掘研究过程中,对连续型属性一般要进行离散化。特别是在模糊数据挖掘中,还要对离散化的区间进行模糊处理。文中依托云模式,并结合粗糙集理论提出一种新的连续型属性离散化算法。  相似文献   

7.
基于混合概率模型的无监督离散化算法   总被引:10,自引:0,他引:10  
李刚 《计算机学报》2002,25(2):158-164
现实应用中常常涉及许多连续的数值属性,而且前许多机器学习算法则要求所处理的属性取离散值,根据在对数值属性的离散化过程中,是否考虑相关类别属性的值,离散化算法可分为有监督算法和无监督算法两类。基于混合概率模型,该文提出了一种理论严格的无监督离散化算法,它能够在无先验知识,无类别是属性的前提下,将数值属性的值域划分为若干子区间,再通过贝叶斯信息准则自动地寻求最佳的子区间数目和区间划分方法。  相似文献   

8.
陈思  郭躬德 《福建电脑》2009,25(2):16-17
在机器学习和数据挖掘领域,数值属性离散化是一个重要的研究课题.本文对现有的基于粗糙集理论的数值属性离散化算法进行了较深入的研究,客观地评价它们的优缺点.并在此基础上针对Naive Scaler数值属性离散化算法及其现有的改进算法的不足,提出了一种新的Naive Scaler算法的改进算法,最后通过算法示例验证了该算法的有效性和可行性.  相似文献   

9.
多变量连续属性离散化方法   总被引:1,自引:0,他引:1  
目前很多离散化方法仅考虑单个变量,不能得到最优的离散化方案。文中提出一种多属性关系的数据离散化方法。凭借概率的模型选择和最小描述长度原理,获得多变量离散化衡量标准,基于该标准提出一种有效的启发式算法来寻找最好的离散化方案。对UCI数据集进行分类预测,实验结果表明该方法提高Nave贝叶斯分类器的学习精度。  相似文献   

10.
郭启铭  樊玮 《计算机工程》2008,34(4):111-112,115
在类一属性相关离散化方法的基础上,提出一种基于Cramer’s V的连续属性离散化算法CVM,该方法利用统计学中的Cramer’s V来量化类一属性相关度,以保证离散后的类一属性相关度最大。与CADD和CAIM算法的实验比较以及对离散化后的数据进行C4.5分类测试,表明CVM算法性能良好,其离散化的数据明显地提高了分类器的预测精度。  相似文献   

11.
The problem of the logarithmic discretization of an arbitrary positive function (such as the density of states) is studied in general terms. Logarithmic discretization has arbitrary high resolution around some chosen point (such as Fermi level) and it finds application, for example, in the numerical renormalization group (NRG) approach to quantum impurity problems (Kondo model), where the continuum of the conduction band states needs to be reduced to a finite number of levels with good sampling near the Fermi level. The discretization schemes under discussion are required to reproduce the original function after averaging over different interleaved discretization meshes, thus systematic deviations which appear in the conventional logarithmic discretization are eliminated. An improved scheme is proposed in which the discretization-mesh points themselves are determined in an adaptive way; they are denser in the regions where the function has higher values. Such schemes help in reducing the residual numeric artefacts in NRG calculations in situations where the density of states approaches zero over extended intervals. A reference implementation of the solver for the differential equations which determine the full set of discretization coefficients is also described.  相似文献   

12.
一种改进的启发式离散化算法及应用   总被引:1,自引:0,他引:1  
Nguyen S.H提出的布尔逻辑和粗糙集理论相结合的离散化算法是粗糙集理论中的离散化算法在思想上的重大突破。通过定义分界点来区分Nguyen S.H离散化算法中定义的断点对决策系统的分辨关系是否有贡献,并仅取分界点集作为初始断点集,使得初始断点数目较大幅度地降低,提出了一种改进的启发式离散化算法并应用于一个实际的决策系统的连续属性离散化。应用实例表明改进算法较大程度地减小了算法空间复杂性和时间复杂性,具有正确性和实用性。  相似文献   

13.
在旋转机械故障诊断领域中,通常需要对连续特征量进行离散化预处理,以便后续诊断分析。为此,该文在分析了ChiMerge离散方法及其两点不足的基础上,提出了一种新的基于冲突水平的多特征离散方法。该方法可以自动实现多特征的离散化操作,并且收敛到预设的冲突水平上。算例分析证明了该方法的有效性。  相似文献   

14.
一种改进的CAIM算法   总被引:1,自引:0,他引:1       下载免费PDF全文
在CAIM算法中,离散判别式仅考虑了区间中最多的类与属性间的依赖度,使离散化过度而导致结果不精确。基于此,提出对CAIM的改进算法,该算法考虑到按属性重要性从小到大顺序进行离散,同时根据粗糙集理论提出条件属性可分辨率概念,与近似精度同时控制信息表最终的离散程度,有效解决了离散化过度问题。实验通过C4.5和支持向量机分别对离散化后的数据进行识别和分类预测,结果证明了该算法的有效性。  相似文献   

15.
基于信息熵的粗糙集连续属性离散化算法   总被引:60,自引:0,他引:60  
谢宏  程浩忠  牛东晓 《计算机学报》2005,28(9):1570-1574
该文提出了一种新的粗糙集连续属性离散化算法.首先对每一个候选断点定义了信息熵,以此作为对断点重要性的量度,在此基础上给出了断点选择的粗糙集连续属性离散化算法.最后采用多组数据对此算法的性能进行了检验,并与其它算法做了对比实验.实验结果表明此算法是有效的,而且当候选断点个数增多时仍有很高的计算效率.  相似文献   

16.
提出了一种结合粗糙集和粒子群的连续属性离散化算法,采用了MPSO算法的思想,提高了粒子群摆脱局部极值的能力,得到了较好的离散化效果。对不同的数据集进行了多次测试,结果表明该算法在对数据离散化时有较好的性能。  相似文献   

17.
提出一种基于改进粒子群的连续属性离散化算法。该算法结合集群智能优化理论和粗糙集理论,将各属性离散化分割点初始化为粒子群体,通过粒子间的相互作用寻求最优离散化分割点。将提出的离散化算法应用于UCI数据集实验中,实验结果表明,该算法能使决策系统的信息损失降低到最小,并可获取更为简洁的决策规则。  相似文献   

18.
针对粗糙集不能较好地处理连续型属性的问题,结合粗糙集理论和粒子群算法,提出基于自适应混合禁忌搜索粒子群的连续属性离散化算法。首先,该算法通过对参数的自适应更新操作,从而避免了粒子群出现早熟的现象;然后将粒子群当代得到的全局最优粒子送入禁忌算法中进行优化,有效地提升了算法的局部探索能力;在兼顾决策表系统一致性的同时,将划分的断点初始化为一群随机粒子,通过改进后粒子群的自我迭代得到最佳的离散化划分点。实验结果表明,与其他结合粗糙集的离散化算法相比,该算法具有更高的规则分类精度和较少的离散化断点个数,对连续属性的离散化效果较好。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号