首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 234 毫秒
1.
针对原始信息系统往往存在大量重复样本和冗余属性,从而影响实际故障诊断的精度和速度这一问题,介绍了一种基于粗糙集和决策树C4.5算法相融合的故障诊断模型,用于设备的精确和快速故障诊断.利用粗糙集具有较强的处理不确定和不完备信息的能力,对原始样本集进行离散化及约简处理;同时,利用决策树C4.5算法对约简后的决策表进行快速学习并形成树状故障分类器.以实例介绍了利用该模型进行故障诊断的完整过程.  相似文献   

2.
决策树是医疗数据挖掘中一种重要分类方法,针对原始医疗数据存在大量重复样本和冗余属性,影响医疗诊断的精度和速度这一问题,提出了一种基于粗糙集和ID3算法相结合的决策树方法.将所提方法应用于冠心病诊断决策,并对属性约简前后的决策性能进行了比较分析.实验表明了该方法的有效性和实用性.  相似文献   

3.
将数据挖掘中的决策树与粗糙集理论进行了有机结合,提出了一种基于粗糙集技术的决策树构造算法,并将该算法应用于胶合板缺陷检测.通过粗糙集属性约简,找出造成胶合板缺陷的关键因素;再基于约简后的决策表,使用该决策树算法构建决策树,从而提取分类规则,指导决策过程.通过实验验证了,该算法可以有效对胶合板的缺陷进行检测.  相似文献   

4.
在多标记学习中,属性约简是解决多标记数据维数灾难的一个关键技术.针对邻域粗糙集属性约简在计算正域代价较大和多标记数据中标记具有不同的强弱性问题,提出了基于邻域粗糙集的多标记属性约简算法.该算法首先利用样本在整个属性空间下到其异类样本的平均距离与到其同类样本的平均距离的差值对标记进行加权;其次,利用取整函数对样本空间进行划分,提出了一种新的多标记邻域粗糙集快速计算正域的方法;最后,根据前向贪心搜索算法进行属性约简,以获得一组新的属性排序.实验给出了5个多标记数据集在4个评价准则上的对比结果,实验结果分析表明了所提算法的有效性.  相似文献   

5.
探讨数据挖掘过程中,数据预处理应用粗糙集理论进行属性和属性值约简的方法以及用计算机实现约简的算法.通过对医疗数据的预处理表明,利用粗糙集理论来进行数据预处理是一种十分有效的精简、求最小决策算法的有效方法.  相似文献   

6.
蔡星 《科技咨询导报》2014,(12):40-40,45
该文对传统的C 4.5决策树数据挖掘算法进行了改进,提出了一种双重熵平均决策树算法。传统的C 4.5决策树算法易出现无意义分枝,过度拟合等问题,针对该类问题,基于双重熵平均决策树算法,通过两次对样本子集熵平均值的计算、排序、合并处理,得到修正后的属性信息增益,并以此作为属性选择的依据,从而解决了传统C 4.5决策树算法可解释性差、易产生碎片等问题。  相似文献   

7.
基于Rough集的数据挖掘在教学评价中的应用   总被引:2,自引:0,他引:2  
基于粗集的数据挖掘的主要过程是数据预处理、约简及规则提取.为了分析教师教学行为和教学效果之间的关系,以教学评价的数据为基础,利用基于粗糙集的数据挖掘技术进行挖掘.实例研究中采用基于分明矩阵的属性约简算法和启发式属性值约简算法,去掉决策表中的冗余属性和属性值,得到了影响教学效果的关键因素刎和相关规则.  相似文献   

8.
决策树C4.5算法在森林资源二类调查中的应用   总被引:3,自引:0,他引:3  
C4.5算法是基于信息熵理论进行数据分类分析的经典决策树数据挖掘算法.它主要包括数据预处理、决策树生成、决策树修剪、决策树规则提取等步骤.笔者将C4.5算法应用于森林资源二类调查的数据分析中,通过对调查数据挖掘分析表明,数据挖掘在森林资源调查数据分析中具有广泛的应用前景.  相似文献   

9.
针对传统的故障诊断方式已经不能满足风电故障系统实时性、准确性的要求,提出了基于Hadoop框架,并结合粗糙集属性约简以及Apriori算法共同处理分析风电机组监测数据,进而实现快速、准确地诊断风机故障的方法:首先利用属性约简减小数据规模,剔除冗余属性项;之后通过MapReduce框架改进Apriori算法,提高数据挖掘效率,降低时间和空间复杂度.实验表明:该算法在保证诊断准确率的前提下,具有良好的性能,也证明了该算法的有效性和可行性.  相似文献   

10.
一种基于粗糙集理论的数据挖掘算法的研究   总被引:6,自引:0,他引:6  
研究了粗糙集理论在数据挖掘中的应用,提出了一种基于粗糙集理论的数据挖掘算法.首先对信息系统的数据加工泛化,构造其二进制可辨矩阵.对矩阵进行化简得到属性约简并生成规则.最后,结合银行申请信用卡的实例,利用上述方法进行数据挖掘,消去冗余属性,抽取决策规则.  相似文献   

11.
基于Rough集的决策树算法   总被引:1,自引:0,他引:1  
针对基于Rough集的经典分类算法值约简算法等不适合大数据集的问题,提出了基于Rough集的决策树算法。采用一个新的选择属性的测度——属性分类粗糙度作为选择属性的启发式,该测度较Rough中刻画属性相关性的测度正区域等更为全面地刻画了属性分类综合贡献能力,并且比信息增益和信息增益率的计算更为简单。采取了一种新的剪枝方法——预剪枝,即在选择属性计算前基于变精度正区域修正属性对数据的初始划分模式,以更有效地消除噪音数据对选择属性和生成叶节点的影响.采取了一种与决策树算法高度融合的简单有效的检测和处理不相容数据的方法,从而使算法对相容和不相容数据都能进行有效处理。对UCI机器学习数据库中几个数据集的挖掘结果表明,该算法生成的决策树较ID3算法小,与用信息增益率作为启发式的决策树算法生成的决策树规模相当。算法生成所有叶节点均满足给定最小置信度和支持度的决策树或分类规则,并易于利用数据库技术实现,适合大数据集。  相似文献   

12.
Rough集在乳腺癌辅助诊断中的应用   总被引:1,自引:0,他引:1  
目的研究Rough集在乳腺癌辅助诊断中的应用。方法采用基于Rough集的属性约简算法,利用决策树算法对乳腺癌图像数据进行分类,辅助医疗诊断。结果实现了基于Rough集的属性约简算法,对乳腺癌数据进行处理,获得了分类的实验结果。结论该模型系统达到了较高的分类准确率,证明Rough集在辅助医疗诊断中有着广泛的应用前景。  相似文献   

13.
云计算技术是海量数据挖掘的一种高效解决方案,将MapReduce并行计算模型与粗糙集属性约简算法相结合,提出一种基于MapReduce的浓缩布尔矩阵并行属性约简算法.该算法提高了粗糙集属性约简算法对大数据的处理能力和效率,并能适应云计算环境.实验结果表明,所提算法具有良好的效率、加速比和可扩展性.  相似文献   

14.
基于粗集论中属性依赖度的ID3改进算法   总被引:3,自引:0,他引:3  
决策树算法是一种重要的数据挖掘方法,ID3算法是最具影响的一种决策树生成算法。介绍了粗集理论的相关概念和传统的ID3算法基本原理,提出了一种以粗集论中的属性依赖度为基础的ID3改进算法,克服了传统ID3算法对取值较多属性的依赖,并通过实例验证该算法的高效性和精确性。改进算法对不同领域中分类预测方向上的数据挖掘均具有一定的参考价值。  相似文献   

15.
洪月华  徐霜  梁家荣 《广西科学》2013,20(2):128-131,136
为了实现对无线传感器网络监测得到的高维冗余且不确定的数据进行分类识别,提出一种由遗传算法和粗糙集进行优化的BP神经网络数据分类器模型,并形成了数据挖掘分类算法。该模型通过粗糙集理论的属性约简算法删除训练样本的冗余属性,利用遗传算法对神经网络的权值和阈值进行优化,并进行神经网络学习。数据挖掘分类算法学习速度快,能够有效提高无线传感器网络中数据的分类效率。  相似文献   

16.
基于粗糙集的支持向量机故障诊断   总被引:2,自引:0,他引:2  
该文结合粗糙集属性约简及支持向量机分类机理,提出了一种新的故障诊断方法。首先利用粗糙集对过程特征变量进行约简,去除冗余的过程信息,并降低过程数据的维数,获得具有代表性的过程特征信息。基于该特征信息建立支持向量分类机用于故障的诊断。以高压直流输电系统为例,对交流单相接地故障和直流接地故障进行诊断,诊断时间分别为12ms和11ms,诊断正确率分别为98.8%和96.8%。  相似文献   

17.
文根据一种基于粗糙集理论的数据挖掘方法,以市场调查数据为研究对象,通过适当的约简算法,得出简化的决策集,分析私家车潜在消费者群体特征。提出了一种启发式的约简算法,在属性约简之前,首先定义了一种条件属性分类能力强度,根据各属性分类能力强度对决策表进行排序,然后采用逐行扫描的方法逐条判断属性是否为不必要属性,解决了属性约简可能出现多个约简结果需要靠人为选取满意结果的问题。  相似文献   

18.
传统的决策树方法在实际应用中存在很多不足,如生成树规模过大,抗噪性较差等,因此,提出了将变精度粗糙集和混合变量集算法应用于决策树分类中,通过变精度和混合属性集分类减小树的规模和过度拟合问题,降低了噪声数据对属性选择的影响,并通过实验证明该算法与传统的算法相比具有较大的优越性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号