首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 187 毫秒
1.
基于改进蚁群算法的分类规则挖掘   总被引:1,自引:0,他引:1  
数据分类是数据挖掘中的一个重要课题,研究各种高效的分类算法是数据挖掘的重要问题之一.本文将蚁群算法与分类规则抽取问题相结合,提出了一种基于蚁群算法的具有自适应和变异杂交特征的分类规则挖掘方法,自适应地调整信息素增量,在规则构造中进行杂交变异,有效地节省了计算时间,并优化了生成的分类规则.实验结果表明:该算法可以有效克服停滞,提高搜索效率,有效地挖掘出简洁分类规则.  相似文献   

2.
随着科技的发展,信息技术的应用与商业领域的结合广为流行,并带来很大的利益.但是,商业中大量数据需要行之有效的处理方法.本文介绍了在商业中数据挖掘的重要性与必要性,重点介绍了数据挖掘中进行分类与预测的各类算法.  相似文献   

3.
数据挖掘中的分类问题在商业领域中有着重要价值,把数据挖掘中的组合分类方法作为研究目标,依据组合分类的方法的思想,采用基于遗传算法的组合算法,提出一种基于遗传算法的多重决策树并行组合分类方法以提高分类精度。  相似文献   

4.
空间信息的可视化挖掘是数据挖掘领域的热点,具有很强的应用前景.本文从数据挖掘的基本概念入手,详细介绍了可视化数据挖掘的两种分类体系:Keim分类体系和Card分类体系,同时分析了这两种分类体系中各种可视化数据挖掘方法的基本思路,探讨了可视化数据挖掘技术与空间信息领域应用相结合的各种途径,并给出了空间信息可视化挖掘的常用方法.  相似文献   

5.
多关系数据挖掘,是数据挖掘方向其中一个热门的研究内容,并且是具有挑战的一个问题。在处理多关系时,传统的数据挖掘算法需要进行物理连接,因而存在效率不高的问题。为了解决这个问题,研究多关系数据挖掘的分类,提出一种有效的多关系决策树分类算法,名为EMDT。EMDT的目标是提高分类准确率,并减少运行时间。EMDT利用元组ID传播,构造出一颗决策树,可以直接在多关系中对类标号未知的元组进行分类,不需要进行物理连接。实验表明,EMDT提高分类准确率,并显著减少运行时间。  相似文献   

6.
针对采用频繁模式树构造的最长频繁闭项集的聚类算法,提出该算法在一些特殊环境下可能产生的误差,因而建议在一些应用情况下,不宜采用该算法进行数据挖掘中的数据分类.  相似文献   

7.
基于数据挖掘可视化技术,构造了一个决策树可视化系统模型,对数据挖掘中决策树可视化模型进行了分析与研究,其中主要实现了数据可视化、属性约简和决策树可视化模块。针对传统的决策树ID3算法偏向取值较多属性的缺点提出了一个算法,将多类问题转换成2类问题,避免了ID3算法形成的决策树过细,分类不够准确等问题。该算法产生的规则比ID3算法更加简捷,更加概括化,避免了规则中包含不关键的属性。  相似文献   

8.
随着高等学校招生规模的扩大,大学生就业形势日益严峻。数据挖掘技术可以从大量的历史数据中发现内在的规律和联系。对高校学生就业进行数据挖掘,可发现潜在规律,为就业指导提供决策依据。决策树分类方法是一种有效的数据挖掘方法,但该方法不能很好地处理数据模糊性和不确定性问题。本文提出将模糊决策树算法引入高校就业数据挖掘,解决了数据模糊性和不确定性的问题,生成的知识表示方式自然,易于理解,并且具有更强的分类能力及稳健性。  相似文献   

9.
在分析数据仓库和数据挖掘重要性的基础上,指出了数据挖掘的基本过程、数据挖掘的分类和应用,介绍了使用分类模型进行数据挖掘的应用实例,论述了实现原始数据到应用数据转换的方法.  相似文献   

10.
本文对数据挖掘的两种重要新方法粗糙集理论和神经网络以及它们的应用进行了分析、比较,总结出每种算法的性能特征,以便于使用者了解掌握各种分类算法、更好地选择合适的算法。  相似文献   

11.
决策树在耕地地力等级评价中的应用   总被引:1,自引:0,他引:1  
司巧梅  宋丽 《安徽农业科学》2011,39(12):7328-7329,7417
在介绍数据挖掘技术的基本概念、决策树方法的基础上,结合牡丹江市地力等级数据样本,采用决策树ID3分类算法建立了耕地地力等级决策树分级图。通过该分级图可以预测各地区耕地地力等级,为该领域的数据挖掘提供了合理的挖掘方式。  相似文献   

12.
陈玉峰  张红燕  敬松  谢元瑰 《安徽农业科学》2011,39(33):20896-20898
在深入分析数据挖掘理论与农民工的主要特征要素的基础上,运用决策树模型中的ID3算法,对样本进行整理、转换以及分类,构建基于数据挖掘的农民工就业的推荐系统,以从大量的信息中发现规律和知识,为企业提供高效、科学的方法招聘相关的技术人才。  相似文献   

13.
自动分类是数据挖掘和机器学习中非常重要的研究领域。针对难以获得大量有类标签的训练集问题,提出了基于小规模训练集的增量式贝叶斯Bayes分类,给出增量式Bayes分类机理参数计算及其算法。对算法分两种情况处理,第一种情况是新增样本有类别标签,利用现有分类器检验其类标签,如果匹配则保留当前分类器,否则利用新样本修正分类器;第二种情况是新增样本无类别标签,则利用现有分类器为其训练类标签,然后利用新样本来修正分类器。试验结果表明,该算法是可行有效的,比Naive Bayes分类算法有更高的精度。增量式Bayes分类算法的提出为分类器的更新提供了一条新途径。  相似文献   

14.
关联规则是数据挖掘中一种简单但很实用的规则,文章简要介绍了关联规则的概念及其分类,以及当前关联规则的挖掘算法研究情况,重点介绍了经典的基于Apriori类的候选生成方法和基于FP-tree的方法,并针对当前改进的挖掘算法进行简要说明,最后提出关联规则将来的发展方向。  相似文献   

15.
This paper evaluates the feasibility of applying visible-near infrared spectroscopy for in-field detection of Huanglongbing (HLB) in citrus orchards. Spectral reflectance data from the wavelength range of 350-2500 nm with 989 spectral features were collected from 100 healthy and 93 HLB-infected citrus trees using a visible-near infrared spectroradiometer. During data preprocessing, the spectral data were normalized and averaged every 25 nm to reduce the spectral features from 989 to 86. Three datasets were generated from the preprocessed raw data: first derivatives, second derivatives, and a combined dataset (generated by integrating preprocessed raw data, first derivatives and second derivatives). The preprocessed datasets were analyzed using principal component analysis (PCA) to further reduce the number of features used as inputs in the classification algorithm. The dataset consisting of principal components were randomized and separated into training and testing datasets such that 75% of the dataset was used for training; while 25% of the dataset was used for testing the classification algorithms. The number of samples in the training and testing datasets was 145 and 48, respectively. The classification algorithms tested were: linear discriminant analysis, quadratic discriminant analysis (QDA), k-nearest neighbor, and soft independent modeling of classification analogies (SIMCA). The reported classification accuracies of the algorithms are an average of three runs. When the second derivatives dataset were analyzed, the QDA-based classification algorithm yielded the highest overall average classification accuracies of about 95%, with HLB-class classification accuracies of about 98%. In the combined dataset, SIMCA-based algorithms resulted in high overall classification accuracies of about 92% with low false negatives (less than 3%).  相似文献   

16.
提出一种基于RBF神经网络的数据挖掘方法,将RBF神经网络应用于数据挖掘的分类和预测中,解决钢构件过程中的性能预测问题。其中用黄金分割法确定基于RBF神经网络的隐层节点数,减少该算法的计算复杂度,最终将其应用于某钢铁企业质量控制系统。构建对钢构件质量检测的数据挖掘及质量追溯平台,该平台是基于RBF神经网络的数据挖掘技术的。实际应用证明,产品的质量合格率可达到96.27%,符合国家相关的标准和技术指标。  相似文献   

17.
人工鱼群算法(AFSA)是一种新提出的新型仿生优化算法。遗传算法是一种基于生物自然选择与遗传机理的随机搜索与优化方法。聚类在数据挖掘、统计学和机器学习等很多领域都有广泛应用。聚类问题实质是一个全局优化问题。将遗传算法中的选择和变异融合到人工鱼群算法,提出一种人工鱼群算法与遗传算法的融合算法,并应用于求解聚类问题,结果该算法保持了AFSA算法简单、易实现的特点,仿真试验取得了较好的效果。  相似文献   

18.
KNN和SVM算法在中文文本自动分类技术上的比较研究   总被引:3,自引:0,他引:3  
中文文本分类技术在中文信息智能处理方面具有十分重要的作用,比如:中文信息检索和搜索引擎等,KNN、贝叶斯、SVM等算法都可以应用到中文文本分类技术上,本研究分析和比较了KNN和SVM两种分类算法,并通过实验比较这两种算法对中文文本分类技术的效果。结果表明:SVM算法较优,是一种较好的中文文本分类算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号