排序方式: 共有24条查询结果,搜索用时 31 毫秒
1.
2.
4.
5.
讨论邮件社区的划分及邮件社区的性质;提出一种基于微-宏聚类的邮件社区划分算法,在宏聚类之后加入了调整划分策略,显著提高了划分质量.本算法根据邮箱通信行为特征定义邮箱问的联系紧密度,采用微聚类-宏聚类找到联系比较紧密的簇,然后通过对个别节点做合理的簇间调整来找到真正的结果簇.实验表明,这种社区划分算法能够发现高质量的社区. 相似文献
6.
7.
基于决策树的组合分类器可以看作一个森林。提出了一种森林剪枝算法来对森林进行剪枝,以简化组合分类器的结构,并提高其分类准确率。传统的决策树剪枝只考虑剪枝对单棵决策树的影响,而森林剪枝则把所有决策树看作一个整体,更加关注剪枝对组合分类器的性能影响。为了确定森林的哪些分枝可以被剪枝,提出一种称作贡献增益的度量。子树的贡献增益不仅与它所在的决策树的分类准确率有关,而且也与诸决策树的差异性有关,因此它较好地度量了一个结点扩展为一棵子树对组合分类器分类准确率的提高程度。借助于贡献增益,设计了一种基于结点贡献增益的森林剪枝算法FTCG。实验表明,无论森林是基于某种算法(如bagging)构建的还是某种组合分类器选择算法(如EPIC[1])的结果,无论每棵决策树是未剪枝的还是剪枝后的,FTCG都能进一步降低每棵决策树的规模,并且在大部分数据集上显著提高了剪枝后的组合分类器的分类准确率。 相似文献
8.
提出一种基于特征变换的Tri Training算法。通过特征变换将已标记实例集映射到新空间,得到有差异的训练集,从而构建准确又存在差异的基分类器,避免自助采样不能充分利用全部已标记实例集的问题。为充分利用数据类分布信息,设计基于Must link和Cannot link约束集合的特征变换方法(TMC),并将其用于基于特征变换的Tri Training算法中。在UCI数据集上的实验结果表明,在不同未标记率下,与经典的Co Training、Tri Trainng算法相比,基于特征变换的Tri Training算法可在多数数据集上得到更高的准确率。此外,与Tri LDA和Tri CP算法相比,基于TMC的Tri Training算法具有更好的泛化性能。 相似文献
9.
10.
提出了一种基于置换策略的组合分类器剪枝方法,该方法中,初始化子组合分类器S为预定义大小,然后迭代地用较好的基分类器置换S中最差的基分类器.为了确定是否应该进行置换,提出了一种基于差异性的度量指标,用于度量基分类器对组合分类器的贡献.实验结果表明,该方法能够有效地降低组合分类器规模,并提高它的泛化能力. 相似文献