共查询到10条相似文献,搜索用时 906 毫秒
1.
2.
数据挖掘是从大量原始数据中抽取隐藏知识的过程。大部分数据挖掘工具采用规则发现和决策树分类技术来发现数据模式和规则,其核心是归纳算法。与传统统计方法相比,基于机器学习技术得到的分类结果具有较好的可解释性。在针对特定的数据集进行数据挖掘时,如果缺乏相应的领域知识,用户或决策者就很难确定选择何种归纳算法。因此,需要尝试各种算法。借助MLC++,决策者能够轻而易举地比较不同分类算法对特定数据集的有效性,从而选择合适的分类算法。同时,系统开发人员也可以利用MLC++设计各种混合算法。 相似文献
3.
4.
ID3算法是进行数据分类分析的经典决策树数据挖掘算法,应用广泛。文中阐述了ID3算法基本原理以及近年来许多学者对该算法的一些改进。最后将该算法运用到高校教师教学质量评价体系中,通过建立有关教师教学质量属性的决策树模型,实现依据教学质量对教师进行分类,通过肯定或否定形成激励作用,从而促进教师教学质量的提高与教育教学的发展。 相似文献
5.
入侵检测是数据挖掘的一个重要应用领域,目前基于数据挖掘的入侵检测方法很多,而基于随机森林的方法具有比较好的性能,但仍存在一些问题。通过分析网络入侵数据得到不同输入属性与分类结果的关系,提出了一种基于属性分组的随机森林算法,并应用该算法对KDD’99数据集分类。实验结果表明,该算法的训练速度和分类准确率都比原算法有较大提高。 相似文献
6.
蚁群优化是人工智能领域中群体智能的分支之一,已经成功地应用于旅行推销员、作业调度选择等优化问题上,但用它解决数据挖掘问题还是一个新的研究课题。本文提出一种蚂蚁分类算法Ant_Miner3,并在Web数据挖掘中采用相应的页面优化分类方法,对非结构化数据集的处理进行了相关的研究和优化。经实验验证,该算法能够导出更优更简洁的分类规则。 相似文献
7.
《计算机应用与软件》2016,(8)
近年来,随着大数据分析需求的急剧增长,分类算法的运用也越来越广泛,如何为用户选择适用的分类算法成为数据挖掘技术在应用上亟待解决的难题。相关研究表明,同一算法在相似数据集上具有相近的分类效果。根据这一理论,构建基于数据集相似性的分类算法选择模型。首先采用数据集离散化方法来对数据集进行特征提取,构建样本库,然后结合邻近相似的原则为数据集推荐合适的分类算法。通过UCI数据集上的算法实验,结果表明大多数情况下推荐得到的分类算法具有良好的性能。 相似文献
8.
9.
数据库、数据仓库以及其他存储信息库中潜藏着很多与商业、科学研究等活动的决策有关的数据和知识。对于数据挖掘中的数据分析,通常有两种常见的方法,即分类和预测,首先对数据库中的数据进行分类归纳,然后根据分类规则可以得到比较有价值的数据,然后我们可以根据这个数据来预测得到一些包含未来趋势的信息。在常见的分类算法中,决策树算法是一个有着很好扩展性的算法,可以应用到大型数据库中,可以对多种数据类型进行处理,分类模式容易转化为分类规则,结果也十分的浅显易懂易于理解。该文主要先介绍了几种常用的分类算法,然后具体介绍决策树算法的过程以及在分类算法实际应用中的优缺点。 相似文献
10.
数据挖掘中分类算法的研究及其应用 总被引:13,自引:1,他引:13
分类算法是数据挖掘中的最重要的技术之一.作者对具有代表性的分类算法进行了分析和比较;并应用分类方法在居民出行数据中挖掘出一些公交乘客规则,讨论了数据挖掘方法在公交乘客预测中应用的前景和实效. 相似文献