共查询到18条相似文献,搜索用时 62 毫秒
1.
2.
3.
基于Bagging的组合k-NN预测模型与方法 总被引:1,自引:0,他引:1
k-近邻方法基于单一k值预测,无法兼顾不同实例可能存在的特征差异,总体预测精度难以保证.针对该问题,提出了一种基于Bagging的组合k-NN预测模型,并在此基础上实现了具有属性选择的Bgk-NN预测方法.该方法通过训练建立个性化预测模型集合,各模型独立生成未知实例预测值,并以各预测值的中位数作为组合预测结果.Bgk-NN预测可适用于包含离散值属性及连续值属性的各种类型数据集.标准数据集上的实验表明,Bgk-NN预测精度较之传统k-NN方法有了明显提高. 相似文献
5.
为提高数据分类的性能,提出了一种基于信息熵[1]的多分类器动态组合方法(EMDA)。此方法在多个UCI标准数据集上进行了测试,并与由集成学习算法—AdaBoost,训练出的各个基分类器的分类效果进行比较,证明了该算法的有效性。 相似文献
6.
一种大规模网络上的服务组合流程搜索方法 总被引:1,自引:0,他引:1
集中式的自动服务组合和非平凡服务发现能够根据给定的、具有特定输入输出的请求搜索出一系列满足要求的服务组合,是当前服务计算领域的研究热点.针对集中式结构带来的性能瓶颈和单点故障问题,提出了一种利用基于内容的分布式发布订阅技术实现大规模网络环境下的无中心自动服务组合方法,称之为流程搜索.基于内容的分布式发布订阅系统能够根据发布消息和订阅消息之间的内容匹配关系,将发布者提供的消息通过一系列中介节点转发给感兴趣的订阅者. 它可以为服务接口之间的可互操作性判定以及查询路由提供支持.将服务模型映射为发布订阅的消息模型,并利用基于内容的路由设计形成分布式环境下的搜索算法,并基于PADRES系统开发了一个PreSee原型系统.模拟实验显示,无中心控制的方法相对于集中式的架构而言,可以有效降低系统延迟,提高整个系统的效率. 相似文献
7.
8.
首先分析了粗糙集理论和神经网络这两种理论的特点及其互补性,然后提出了一种构造组合分类器的新方法C3RST。新方法包括两个步骤,先对训练数据集进行约简,以此确定单个神经网络分类器的结构以及在组合分类器中要包含的分类器数目;然后将这些分类器组合起来,组合过程中各单个分类器的权值由粗糙集理论中的基本概念——属性重要性来决定。最后,在一些标准数据集上做实验验证C3RST的分类性能,结果表明该方法是有效的。 相似文献
9.
基于Boosting的TAN组合分类器 总被引:8,自引:1,他引:8
Boosting是一种有效的分类器组合方法,它能够提高不稳定学习算法的分类性能,但对稳定的学习算法效果不明显,TAN(tree-augmented naive Bayes)是一种树状结构的贝叶斯网络,标准的TAN学习算法生成的TAN分类器是稳定的,用Boosting难以提高其分类性能,提出一种构造TAN的新算法GTAN,并将由GTAN生成的多个TAN分类器用组合方法Boosting-MultiTAN组合,最后实验比较了TAN组合分类器与标准的TAN分类器.实验结果表明,在大多数实验数据上,Boosting-MultiTAN分类器显示出较高的分类正确率。 相似文献
10.
11.
传统的聚类算法能够将数据集划分成不同的簇,但是这些簇通常都是难以解释的. IMM (iterative mistake minimization)是一种常见的可解释聚类算法,通过单个特征来构造阈值树,每个簇都可以用根节点到叶子节点路径上的特征-阈值对进行解释.然而,阈值树在每一轮划分数据时仅考虑错误最少的特征-阈值对,这种贪心的方法容易导致局部最优解.针对这一问题,本文引入了集束搜索,通过在阈值树的每一轮划分过程当中保留预定数量的状态来减缓局部最优,进而提高阈值树提供的聚类划分与初始聚类划分的一致性.最后,通过实验验证了该算法的有效性. 相似文献
12.
释义生成任务是指为一个目标词生成相应的释义。该文在中文释义生成任务中使用了目标词的上下文信息,并提出了一个基于BERT与柱搜索的释义生成模型。该文构建了包含上下文的CWN中文数据集,同时也在Oxford英文数据集上开展了实验。实验结果显示,该文模型在中英文数据集上性能均有显著提升,其中CWN数据集实验结果相比基线模型BLEU指标提升了10.47,语义相似度指标提升了0.105。语义相似度指标与人工评价结果相关性更高。最后,该文分析了中文释义生成任务仍存在的四个问题。 相似文献
13.
14.
针对现有关联分类算法资源消耗大、规则剪枝难、分类模型复杂的缺陷,提出了一种基于分类修剪的关联分类算法改进方案ACCP.根据分类属性值的不同对分类规则前项进行分块挖掘,并对频繁项集挖掘过程和规则修剪进行了改进,有效提高了分类准确率和算法运行效率.实验结果表明,此算法改进方案相比传统CBA算法和C4.5决策树算法有着更高的分类准确率,取得了较好的应用效果. 相似文献
15.
基于Multi-Agent的分类器融合 总被引:14,自引:0,他引:14
针对决策层输出的分类器融合问题,该文提出了一种基于Multi-Agent思想的融合算法,该算法将分类器融合问题建模为人类发源地问题,通过引入决策共现矩阵,并在智能体之间进行信息交互,从而利用了分类器之间的决策相关信息,算法根据在融合训练集上得到的统计参量,指导各个智能体向不同类别溯源,并通过智能体之间的信息交换改变溯源概率,最终达到群体决策,得到决策类别,本文在标准数据集上对该算法进行了实验研究,通过与其它一些融合方法的比较,得出在用于融合的分类器较少时,该算法得到比其它方法更低的分类错误率,其空间复杂度相对BKS方法较小,实验证实,该算法是收敛的。 相似文献
16.
17.
18.
基于FP-Tree 的快速选择性集成算法 总被引:2,自引:1,他引:2
选择性集成通过选择部分基分类器参与集成,从而提高集成分类器的泛化能力,降低预测开销.但已有的选择性集成算法普遍耗时较长,将数据挖掘的技术应用于选择性集成,提出一种基于FP-Tree(frequent pattern tree)的快速选择性集成算法:CPM-EP(coverage based pattern mining for ensemble pruning).该算法将基分类器对校验样本集的分类结果组织成一个事务数据库,从而使选择性集成问题可转化为对事务数据集的处理问题.针对所有可能的集成分类器大小,CPM-EP算法首先得到一个精简的事务数据库,并创建一棵FP-Tree树保存其内容;然后,基于该FP-Tree获得相应大小的集成分类器.在获得的所有集成分类器中,对校验样本集预测精度最高的集成分类器即为算法的输出.实验结果表明,CPM-EP算法以很低的计算开销获得优越的泛化能力,其分类器选择时间约为GASEN的1/19以及Forward-Selection的1/8,其泛化能力显著优于参与比较的其他方法,而且产生的集成分类器具有较少的基分类器. 相似文献