共查询到20条相似文献,搜索用时 109 毫秒
1.
三种分类算法的实验比较 总被引:1,自引:0,他引:1
对文本自动分类算中的k最近邻算法、向量空间模型算法以及混合分类算法进行了比较分析,在构造分类用知识库的主题抽取方法相同的条件下,使用中国资讯行提供的2000篇网上新闻语料分别对3种分类算法作了实验研究、实验结果表明,针对网上新闻而言,混合分类算法性能指标优于另外2种算法.结合实验语料环境,对3种分类算法的适用范围作了分析. 相似文献
2.
提出了一种有效的快速k近邻分类文本分类算法,即PSOKNN算法,该算法利用粒子群优化方法的随机搜索能力在训练文档集中进行有指导的全局随机搜索. 在搜索k近邻的过程中,粒子群跳跃式移动,掠过大量不可能成为k近邻的文档向量,从而可以快速找到测试样本的k个近邻. 以Reuters 21578文档集分类为例验证算法的有效性,结果表明,保持k近邻法分类精度,新算法比KNN算法降低分类时间70%. 相似文献
3.
对于分类问题给出了一个限制条件,在此限制条件下构造了一个分类算法,此算法的运算时间是线性的,因为对于通常的分类问题,限制条件都能得到满足,因此构造的算法在分类问题中具有广泛的应用价值。 相似文献
4.
提出了一种基于中文关键字符串核函数的分类算法,并在农业文本上进行了分类性能测试.实验结果表明,与传统的中文分类算法相比,基于中文关键字符串核函数的分类算法准确率更高. 相似文献
5.
对于分类问题给出了一个限制条件,在此限制条件下构造了一个分类算法,此算法的运算时间是线性的,因为对于通常的分类问题,限制条件都能得到满足,因此构造的算法在分类问题中具有广泛的应用价值。 相似文献
6.
为提高核Fisher算法(KFDA)的分类性能,对KFDA算法增加了基因选择步骤.提出了新型的杂交式基因选择算法并用于KFDA分类研究,所提出的方法用于3个基因芯片的数据分类,得到较好的分类效果. 相似文献
7.
为提高分类挖掘的准确度,在分析ID3,C4.5和进化算法(EC)的基础上,设计了两个共同进化的种群分别表示选择的属性子集和分类规则子集,提出基于共同进化计算的分类规则算法(CRCEC),并构建CRCEC算法的适应度评价函数.用4个加利福尼亚大学Irvine分校的数据集对CRCEC,ID3,C4.5和EC算法进行测试比较,结果表明CRCEC算法分类准确度高,可以得到简洁的、可理解性强的规则.最后给出了CRCEC算法在公路车辆征费分类预测系统中的一个应用实例. 相似文献
8.
经典的分类算法对小型数据集分类是非常有效的,但当面对超大型数据集时往往失去了分类能力。在平均值和方差以及新定义的权这三个度量的基础上提出了一种快速有效处理超大型数据集分类问题的新算法一核心向量算法,简称CV算法。试验结果表明,该方法对超大型数据集分类是比较有效的。 相似文献
9.
收集并整合多所高校学生的慕课学习行为数据,设计基于数据复杂度的纠错输出编码(ECOC)多分类算法。该算法利用数据复杂度降低多类之间的分类难度,从而提高算法的预测准确度。实验结果表明,在不同高校的慕课数据集的测试中,所设计基于数据复杂度的ECOC分类算法比传统的ECOC算法具有更高的分类准确度和鲁棒性,实现了学生学习成绩多等级的有效预测,为个性化教学奠定了基础。 相似文献
10.
谭勇 《湖北民族学院学报(自然科学版)》2004,22(2):72-75
在介绍数据挖掘、分类算法有关概念的基础上,介绍了决策树的具体生成算法.为了减少数据量,改进决策树算法实现时的数据结构,详细描述了基于SPRINT(scalable paraUehzable induction of decision trees)分类算法的实现,给出了SPRINT算法的性能评估。 相似文献
11.
Decision in reality often have the characteristic of hierarchy because of the hierarchy of an organization’s structure. In this paper, we propose a two-level hierarchic Markov decision model that considers the interactions of agents in different levels and different time scales of levels. A backward induction algo-rithm is given for the model to solve the optimal policy of finite stage hierarchic decision problem. The proposed model and its algorithm are illustrated with an example about two-level hierar-chical decision problem of infrastructure maintenance. The optimal policy of the example is solved and the impacts of interactions between levels on decision making are analyzed. 相似文献
12.
13.
黄丽萍 《太原师范学院学报(自然科学版)》2007,6(3):124-126
文章提出了一种新的决策树构建算法,算法选择使生成的规则满足给定可信度阀值且支持度最大的属性作为结点,不仅简化了生成的决策树;且可以根据用户输入的可信度,得到相应的决策规则集,提高了决策树的泛化能力,有效地去除了噪音规则。应用实例分析,结果表明算法提取的决策规则简洁有效。 相似文献
14.
基于决策支持度的不完备信息系统约简算法 总被引:1,自引:0,他引:1
提出了一种基于决策属性支持度的属性相对约简算法。通过引入决策属性支持度对不完备决策表中属性的重要性进行了定义,并以此作为启发信息进行属性的选择,该算法的时间复杂度是多项式的。寻找决策表中最小相对约简问题是典型的NP-hard问题,采用该算法可降低问题复杂度。通过实例说明,该算法能得到不完备决策表的最小相对约简。 相似文献
15.
基于粗糙集方法提出了一种系统的决策表约简和决策规则提取方法. 为了避免现有属性离散化方法的不足,使用多元统计中的聚类分析,并借助树形图,R2、半偏相关以及伪F统计量,对连续属性进行离散化处理,得到适合粗糙集方法要求的决策表. 在此基础上,简化了基于可辨识矩阵和逻辑运算的传统属性约简算法,并完善了启发式算法进行属性值约简和决策规则提取. 最后,以应用实例验证了该方法的可行性和有效性. 相似文献
16.
决策树是数据挖掘中的一种重要分类方法。在此以粗糙集理论中的正域为启发式函数,设计了一种新的、有效的决策树构造方法。该算法具有较大的灵活性,能从测试属性空间逐次删除已使用过的属性。避免对这些属性进行重复测试,减少测试空间,降低了树的复杂性,从而提高了分类效率。最后,实例验证了算法的可行性与有效性。 相似文献
17.
高效的属性约简算法是粗糙集理论应用于知识发现的基础,要在令人可接受的时间内获得约简的通常做法是基于启发式的约简方法。本文提出了决策表中决策属性集相对条件属性集的条件信息量的概念,同时用知识的条件信息量定义了属性的重要性,在此基础上,提出了一种新的基于信息量的属性约简算法,该算法的时间复杂度为(O|C|3|U|2),通过实例分析,表明该算法是有效的。 相似文献
18.
基于粗集的混合变量决策树构造算法研究 总被引:1,自引:1,他引:1
文章提出混合变量决策树结构,并在此基础上提出基于粗集理论的混合变量决策树构造算法RSH2,算法在每个结点选择尽可能少的属性明确划分尽可能多的实例,减小了决策树规模,且易于理解。将RSH2算法与ID3算法及基于粗集的单变量决策树算法HACRs进行实验比较,结果表明该算法有良好性能。 相似文献
19.
判决反馈常数模盲均衡算法(CMADFE),在均衡的起始阶段,由于眼图未睁开,容易引起判决器的误判,导致收敛速度慢。为了减小误判的影响,在迭代初期把判决信号加权后送入反馈滤波器中,当均衡一段时间后再把判决信号不需加权直接送入反馈滤波器,从而得到加权的CMADFE算法。计算机仿真表明,加权的CMADFE算法提高了收敛速度,且均方误差亦有所减小。 相似文献
20.
一种新的基于决策熵的决策表约简方法 总被引:2,自引:0,他引:2
分析了在知识约简过程中经典粗糙集理论决策表知识约简方法的不足.以知识粗糙熵为基础,将一致和不一致对象分开,提出决策熵的概念及其属性重要性,在此基础上给出约简的判定定理;然后以条件属性子集的决策熵来度量其对决策分类的重要性,提出一种新的知识约简启发式方法.理论分析和实验结果表明,基于决策熵的属性重要性是一种更有效的启发式信息,该方法时间复杂度较低,有助于搜索最小或次优约简. 相似文献