排序方式: 共有39条查询结果,搜索用时 328 毫秒
21.
结合复杂网络社团结构的相关研究,提出一种基于网络社团结构和模块化函数的聚类算法CSMFBCA(Community Structure and Modularization Function Based Clustering Algorithms)。算法通过数据点之间的关系进行融合,形成一定的数据簇,然后定义一个统筹全局的模块化函数,再通过最大化模块函数值,得到最优的聚类结果。实验结果表明,该算法不仅能很好地解决凹形数据聚类以及聚类个数识别的问题,而且能处理权重无向网络的社团发现问题,比现有的典型算法有明显的优势。 相似文献
22.
数据挖掘具有广泛的应用,频繁模式发现是关联规则挖掘问题的重要组成部分。频繁模式的增量挖掘是一个挑战性的任务,已有的几种基于Apriori思想的方法,具有代价太高的弱点。本文提出了一个基于模式分解树,不需要扫描原数据库的增量挖掘算法。通过合理地组织候选项索引,可以取得较高的效率。 相似文献
23.
传统的K-means算法存在初始质心敏感、需要人为指定K个数等问题,可以通过融合Canopy算法在一定程度上缓解,但是仍然存在抗噪能力弱、质心选择盲目、运算时间长等问题.论文提出了一种改进算法,在抗噪性、初始质心选择、运算过程三方面,对Canopy-K-means算法进行优化.该算法采用了剪枝、"最大最小规则"、相似度计算等策略来实现算法目标.实验数据表明,改进后的Canopy-K-means算法对比传统的Canopy-K-means算法、K-means算法均具有更高的检测率、更低的误报率. 相似文献
24.
25.
26.
传统K-means算法应用于入侵检测,存在聚类数目难以估计的缺点,导致入侵检测效果不佳.针对这个问题,提出了一种改进的K-means入侵检测算法.算法根据有效性指标确定最优的聚类数目;依据各维特征对聚类效果的影响进行加权;引入三支决策聚类方法改善聚类效果.在kddcup99数据集的实验结果表明,与传统K-means算法相比,改进后的K-means算法提高了入侵检测的检测率,降低了其误报率. 相似文献
27.
为了改善传统ItemBased推荐算法在大数据环境下的数据稀疏性问题和可扩展性问题,论文提出了一种基于Hadoop平台的ItemBased推荐算法.通过Pearson相关系数公式获取数据项之间的相关度,并根据数据集中的数据稀疏程度赋予一定的权值.在此基础上,将该算法在Hadoop平台上分布式并行化,在保证算法的平均绝对误差情况下,提升集群的运算速度.实验表明,改进的算法能够改善推荐质量、提高推荐效率,并且在大数据环境下拥有良好的可扩展性. 相似文献
28.
研究生调剂是研究生招生中的重要环节。传统的调剂方法都是通过手工操作的,考生很难从往年大量的调剂数据中分析出规律,选报合适的学校。提出了基于半监督学习的数据挖掘方法,也即是从已知类别的训练样本提取出其中的关联规则作为分类的监督信息,并结合非监督学习方法中的K-mean聚类算法,对大量未标识样本进行分类的算法,此方法克服了研究生调剂涉及因素繁多,无法准确填报的弊端。该方法实现过程简单,分类准确,可推广性较强。 相似文献
29.
微表情检测广泛应用在谎言识别、心理健康和情感分析等场合,构建微表情检测模型需要充足的训练数据,但是标注微表情需要过高的成本,导致自发性微表情样本库数量过少,给微表情检测带来了极大的挑战。针对这个挑战提出一种新的微表情检测方法FLOW-AENET:提取人脸的光流特征,将光流特征作为自编码器的输入,利用深度学习模型对特征进行处理,再将学习到的特征加入SVM分类器中做二分类,在含有微表情的一类中,根据ROIS区域的变化程度判断出微表情产生的起始帧、顶峰帧和结束帧。在CASEME、CASME II等数据集上进行实验研究,结果表明,FLOW-AENET方法相比于其他方法具有明显的优势。 相似文献
30.