首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
连续值属性决策表中的可变精度粗糙集模型及属性约简   总被引:2,自引:0,他引:2  
属性约简是粗糙集理论研究的一个核心问题.为了有效地处理决策表中连续值属性约简,提出了连续值属性决策表中的可变精度粗糙集模型以及基于此模型的连续值属性约简算法.仿真实验结果表明,该算法可以对连续值属性进行约简,而且比经典粗糙集相关方法在处理连续值属性约简方面更有效.  相似文献   

2.
一种连续值属性约简方法ReCA   总被引:1,自引:1,他引:0  
属性约简是Rough集理论的主要应用和研究内容之一.现有的各种属性约简方法大多适用于离散值属性.对于连续值属性的数据处理,通常做法是先对其进行离散化.这种先期对数据进行的处理会丢失一些信息,易于使约简产生错误.针对连续值信息系统,提出了一种新的属性约简方法ReCA,该方法将连续值属性离散化与属性约简过程融为一体,以基于信息熵的不确定性度量作为适应度函数。通过进化计算同时得到约简属性集合和离散化的断点集合.实验表明,该方法不仅可以有效地进行属性约简,而且与Rough集及C4.5两种方法相比,得到的属性数目少、测试精度较高.  相似文献   

3.
采用基于粗糙集属性约简的支持向量机回归预测模型对我国电力供应量进行预测。根据电力供应量及其影响因素的历史数据建立决策表,利用动态层次聚类法对决策表中的连续属性进行了离散化;运用属性约简算法进行约简,提取出主要因素,并将其作为样本的特征,应用支持向量机回归预测模型对电力供应量进行预测。五年预测结果表明:与SVR模型相比,结合了属性约简方法的RS&SVR模型充分利用了更少但是主要的预测因子的信息,预测精度有一定提高,应用效果较好。  相似文献   

4.
决策表中连续属性离散化,即将一个连续属性分为若干属性区间并为每个区间确定一个离散型数值。该文提出一种新的决策表连续属性离散化算法。首先使用决策强度来度量条件属性的重要性,并据此对条件属性按照属性重要性从小到大排序,然后按排序后的顺序,考察每个条件属性的所有断点,将冗余的断点去掉,从而将条件属性离散化。该算法易于理解,计算简单,算法的时间复杂性为O(3kn2)。  相似文献   

5.
决策系统中连续属性的离散化,即实型属性空问向整型属性空间的映射,它是对决策表中属性约简的第一步.针对多值决策属性的决策信息系统,提出一种新的属性离散化算法.首先根据决策属性的不同,将条件属性集划分为不同的序列,对每两个序列求取候选断点,最后,综合所有的候选断点即为所求的候选断点集合;然后在基于条件属性重要度和贪心算法的基础上提出一种确定结果断点子集的新启发式算法.实例验证了本文所提出的算法能够取得较理想的连续属性离散化结果.  相似文献   

6.
决策表连续属性离散化的一种方法   总被引:1,自引:0,他引:1       下载免费PDF全文
提出了一种基于区间数据分布特征的决策表连续属性离散化的方法。方法在断点的选择上考虑了属性值的出现频率,在区间内的一致性和区间之间的差异性基础上,利用条件信息量作为反馈信息合并区间。通过实验分析表明了算法的有效性,能保持决策表较高的分类能力,提高约简效率。  相似文献   

7.
一种决策表增量属性约简算法   总被引:11,自引:0,他引:11       下载免费PDF全文
胡峰  代劲  王国胤 《控制与决策》2007,22(3):268-272
为了对动态变化的决策表进行属性约简处理,在改进的分辨矩阵的基础上,提出一种增量式属性约简算法,当决策表添加新的记录后.能快速得到新决策表的所有约简和最小约筒.此外,通过对不相容决策表的正区域的决策值和边界域对原决策表进行分解.得到了一种分布式增量属性约简模型.仿真研究表明了算法的正确性和高效性.  相似文献   

8.
一种基于Rough集理论的属性约简启发式算法   总被引:9,自引:1,他引:9  
属性约简是知识发现中的关键问题之一.为了能够有效地获取决策表中属性的最小相对约简,在Rough集理论的基础上构造了一个新的算子,将信息论角度定义的属性的重要性作为启发式信息,来描述在决策表中条件属性所提供的知识对决策属性的影响;并采用宽度优先搜索策略,提出了一种新的属性约简启发式算法.以原始条件属性集为起点并结合算子,通过向属性核的递减式逼近,得到属性的最小相对约简.实例分析表明,该算法能有效地对决策表属性进行约简.  相似文献   

9.
一种新的用于连续值属性离散化的约简算法   总被引:4,自引:0,他引:4  
针对在Nguyen和Skowron的离散化算法中进行启发式约简时会出现某些属性不能进行离散化问题,以及在无核数据集中启发式约简算法计算量比较大等问题,在粗糙集理论和属性频率函数的基础上给出一个新概念-候选核,并提出一种新的用于连续值属性离散化的约简算法-基于候选核的启发式约简算法(简称BCC)。该算法可以寻找到能对所有属性进行离散化的约简,实验表明,所提出的BCC算法能提高大数据集的离散化效果。  相似文献   

10.
不相容决策表中一种新的属性约简算法   总被引:1,自引:0,他引:1       下载免费PDF全文
针对不相容决策表中一些属性约简算法的不足,结合粗糙集的代数观与信息观的优点,对差别矩阵加以改进,提出了一种新的属性约简算法,该算法在保证约简后决策表的正域和条件信息熵不变的情况下,降低了时间复杂度。通过实例说明了该算法的有效性和可行性。  相似文献   

11.
传统的基于区分矩阵的属性约简算法只能处理离散数据,而绝大部分数据既包含离散属性又包含连续属性.针对这一问题,本文使用一种可以对离散数据和连续数据进行统一处理的方法.该方法利用柔性逻辑等价关系替代原来的不可分辨关系,简化了传统算法中的离散化过程,提高了算法效率.实验表明,与传统的算法相比,改进后算法省略了离散化这一过程,可以对离散数据和连续数据统一进行处理.  相似文献   

12.
针对决策树C4.5算法在处理连续值属性过程中时间复杂度较高的问题,提出一种新的决策树构建方法:采用概率论中属性间的相关系数(Pearson),对数据集中的属性进行约简;结合属性的信息增益率,保留决策属性的最优子集,保证属性子集中没有冗余属性;采用边界点的判定,改进了连续值属性离散化过程中阈值分割方法,对信息增益率的计算进行修正。采用UCI数据库中的数据集,在Pycharm平台上进行一系列对比实验,结果表明:采用改进后C4.5决策树算法,决策树生成效率提高了约50%,准确率提升约2%,比较有效地解决了原C4.5算法属性选择偏连续值属性的问题。  相似文献   

13.
C4.5算法是一种非常有影响力的决策树生成算法,但该方法生成的决策树分类精度不高,分支较多,规模较大.针对C4.5算法存在的上述问题,本文提出了一种基于粗糙集理论与CAIM准则的C4.5改进算法.该算法采用基于CAIM准则的离散化方法对连续属性进行处理,使离散化过程中的信息丢失程度降低,提高分类精度.对离散化后的样本用基于粗糙集理论的属性约简方法进行属性约简,剔除冗余属性,减小生成的决策树规模.通过实验验证,该算法可以有效提高C4.5算法生成的决策树分类精度,降低决策树的规模.  相似文献   

14.
现实世界中常常包含着海量的、不完整的、模糊及不精确的数据或对象,使得模糊信息粒化成为近年来研究趋势。利用论域上的模糊等价关系定义了模糊粒度世界的模糊知识粒度,给出了新的属性约简条件和核属性计算方法,以便更好地挖掘出潜在的、有利用价值的信息。针对粗糙集在对连续属性约简的过程中容易造成信息缺失和不能对模糊属性处理的现象,提出了一种基于模糊知识粒度对混合决策系统约简的启发式算法,省去了连续属性离散化过程,减少了计算量,为离散值域和混合值域约简提供了统一的方法。最后通过实例验证了其有效性。  相似文献   

15.
一种连续属性离散化的新方法   总被引:6,自引:0,他引:6  
提出了一种基于聚类方法、结合粗集理论的连续属性离散化方法。在粗集理论中有一个重要概念:属性重要度(Attribute significance),它常用来作为生成好的约简所采用的启发式评价函数。受此启发,在连续属性离散化方法中可把它用于属性选择,即从已离散化的属性集中选择出属性重要度最高的属性,再把它和待离散化的连续属性一起进行聚类学习,得到该连续属性的离散区间。文中介绍了该方法的算法描述,并通过实验与其他算法进行了比较。实验结果表明,由于这种方法在离散化过程中结合了粗集理论的思想,考虑了属性间的相互影响,从而产生了比较合理的划分点,提高了规则的分类精度。  相似文献   

16.
为了解决单一神经网络模型很难满足股票预测建模要求的问题,提出一种基于遗传算法的粗糙集属性约简方法和神经网络相结合的预测模型。在该模型中,改进了自适应性遗传算法的交叉算子与变异算子。基于该遗传算法的粗糙集属性约简相比传统的粗糙集属性约简,其具有更强的求解最小属性约简的能力,解决了神经网络预测时训练速度慢、内存开销大等问题;在数据预处理过程中,引入聚类分析,有效解决了连续属性离散化的问题。实验结果证明,该预测模型具有较高的预测精度,在时间序列的股票预测中是相当有效的。  相似文献   

17.
针对新能源智能车监控数据中包含过多的连续属性,提出了一种基于分辨矩阵和信息增益率的有监督离散化算法,从而降低连续属性的取值精度,使得新能源智能车后续的分类模型建立更具泛化能力.该算法在保证分类效果的前提下,获得尽可能少的结果断点,主要从3个方面对传统的离散化算法进行优化,一是根据决策表的条件属性与决策属性构建候选断点分辨矩阵,通过分辨矩阵判断相邻属性取值之间是否有可能的断点;二是用信息增益率来优化结果断点的选取;三是通过设定停止阈值解决了传统算法因停止条件过于严格导致算法选取过多的结果断点、离散化效果一般的问题.实验结果表明,改进的算法能够有效减少断点数量,大幅提高计算效率,并获得与经典算法相近的离散结果.  相似文献   

18.
应用粗糙集提取柴油机故障数据特征   总被引:1,自引:0,他引:1       下载免费PDF全文
根据柴油机故障数据的特点,采用粗糙集理论对其进行特征提取研究。由于实际测量的参数大多为连续数据,而粗糙集只能处理离散数据,提出了一种适用于粗糙集的SOM网络离散化方法;给出一种基于简化差别矩阵的快速属性约简算法;以6135D型柴油机故障诊断数据为例进行特征提取,成功地将原始8个属性约简为3个,为后续研究工作打下了基础。  相似文献   

19.
经典属性约简及其延伸算法是基于有决策属性的信息系统的属性约简算法,它们对无决策属性的信息系统的属性约简无能为力.为此,本文以粗集理论为基础,对无决策属性的信息系统从集合论的论域划分方面进行研究,提出了一种适用于无决策属性的信息系统的启发式属性约简算法.该算法在一定程度上能够解决无决策属性的信息系统属性约简问题,进一步扩展了粗集理论的应用范围.实例表明该算法是有效可行的.  相似文献   

20.
离散化与属性约简相结合算法及Delphi实现   总被引:1,自引:0,他引:1       下载免费PDF全文
主要对Rough Set理论中的离散化问题进行了研究,提出了基于属性值重要性的离散化算法,利用文献[5]中不可分辩类的定义、属性重要性的讨论及属性约简的启发式算法,得到了一种离散化与属性约简相结合的启发式算法,并通过Delphi程序验证了该算法对UCI数据库的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号