首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 125 毫秒
1.
Apriori算法分析与改进综述   总被引:5,自引:0,他引:5  
数据挖掘中的关联规则挖掘能够发现大量数据中项集之间有趣的关联或相关联系,特别是随着大量数据不停地收集和存储,从数据库中挖掘关联规则就越来越有其必要性.通过对关联规则挖掘技术及其相关算法Apriori进行分析,发现该技术存在的问题.本文介绍了能优化该技术的各种算法,分析了这些算法各自的优缺点,并针对这些问题提出了未来的研究方向.  相似文献   

2.
数据挖掘中的关联规则用来发现大量数据中项集之间有趣的关联或相关联系,随着数据库的广泛应用,如何从数据库中挖掘关联规则就越来越有其必要性.本文通过对关联规则挖掘技术及其相关算法Apfiofi进行分析,发现该技术存在的缺陷,介绍了能优化该技术的几种经典算法,分析了这些算法各自的优缺点,并以此为出发点提出了未来的研究方向.  相似文献   

3.
文章提出了一种基于旅游文记挖掘的改进增量关联规则景点推荐算法。该算法紧密关注旅行者偏好,基于分类有效降低了算法空间复杂度,使得挖掘结果聚焦度更高;能够高效处理旅游文记数量增长的状况,避免了反复扫描整个数据集,仅需扫描增量数据集并结合已有挖掘结果便可开展高效运算分析,完成相关景点推荐应用。通过使用网络获取旅游文记作为实例对算法进行验证,表明改进算法在候选项集获取个数方面减少明显,推荐结果清晰明了,有较明显的优势。  相似文献   

4.
针对蛋白质相互作用(protein-protein interaction,PPI)网络的信息不完善和高噪声问题,提出一种融合多生物数据的二分图聚类集成方法以检测网络中的功能模块.该方法结合了基因本体论(gene ontology,GO)、基因表达谱数据以及多种基础聚类算法,用一种新的二分图来组织多种基础聚类算法的中间结果,并结合对称非负矩阵分解(non-negative matrix factorization,NMF)算法挖掘其中功能意义上最一致蛋白质功能模块,同时,该算法能处理蛋白质功能重叠问题.实验结果表明:所提算法整体优于基准比较方法,是一种融合多种生物信息源和不同的聚类方法的有效途径.  相似文献   

5.
以往大多告警分析研究都是假设通信网络中所有告警是平等的,考虑此假设的不合理性,提出了一种加权告警分析方法。首先,根据告警对网络的影响程度,采用熵值法为不同的告警分配不同的权值,并将其转换成适合于数据挖掘的序列数据集;然后,设计了一种加权告警序列模式挖掘算法,并采用了一种新颖的剪枝策略来缩减需要挖掘的数据集大小以提高算法的效率;最后,利用该算法挖掘告警数据中的时序关系。实验结果表明,这种加权告警分析方法在剪枝效果、挖掘重要告警序列模式和执行效率方面具有很好的性能。  相似文献   

6.
为了得到更好的蛋白质功能模块,揭示蛋白质的功能,利用蝙蝠算法对蛋白质相互作用网络(PPINs)进行功能模块检测. 每个蝙蝠个体所在的位置代表一种候选的功能模块划分,将PPIN中每个蛋白质节点与其所有邻居节点组成邻居有序表,采用在邻居有序表中随机游走的编码方式进行种群的初始化;在种群优化过程中,设计定向局部扰动、随机扰动、基于距离和频率的自适应变异、自然选择4种寻优机制来进行解的随机优化. 在5个不同规模的酵母菌PPIN数据集上,将所提出方法与6种经典算法进行对比实验. 结果表明,所提出方法检测到的功能模块中有较多模块与标准模块相匹配,并且所提出算法在覆盖率、召回率、灵敏度、正的预测率、准确度评价指标上均表现突出,验证了所提出方法的有效性.  相似文献   

7.
重叠社区结构的挖掘算法   总被引:1,自引:0,他引:1  
针对大多数社区挖掘算法致力于寻找独立不相重叠的社区结构,而实际的网络中,社区结构往往是重叠的问题。基于凝聚方法和贪婪算法原理,提出了一种新的算法来挖掘社会网络中彼此重叠的社区结构。在模拟数据集和标准测试数据集上的实验结果表明了算法的可行性和有效性。  相似文献   

8.
针对目标跟踪过程中的遮挡、形变和快速运动等问题,提出基于策略梯度的目标跟踪方法. 该方法利用策略梯度算法训练策略网络. 该策略网络能够根据当前跟踪结果的可靠性进行动作决策,以避免错误的模板更新或者重新检测丢失的目标. 在决策过程中,通过计算加权置信度差值分析当前跟踪结果的鲁棒性和准确性,使得策略网络能够更准确地评估跟踪结果. 在重检测过程中,提出有效的重检测方法,对大量的搜索区域进行过滤,大大提高了搜索效率,利用决策模块检验重检测结果,确保重检测结果的准确性. 利用提出的算法在OTB数据集及LaSOT数据集上进行评估. 实验结果表明,提出的跟踪算法在原算法的基础上提高了2.5%~4.0%的性能.  相似文献   

9.
以校园无线局域网为实验环境,采集大量真实用户流量数据集。利用信息熵,提出一种基于时间空间相关的压缩感知采样机制,并以此做为压缩感知的输入条件,提出一种压缩感知网络流量恢复算法,并与最近邻算法进行比较,实验证明本算法能准确恢复全网用户流量,从而更好地均衡网络负载,提高网络性能。  相似文献   

10.
针对群智能聚类方法在蛋白质相互作用网络功能模块检测问题上运行时间长的不足,本文提出了一种基于烟花算法的蛋白质相互作用网络功能模块检测方法(Fireworks Algorithm for Functional Module Detection in Protein-protein Interaction Networks,简称FWA-FMD).首先结合蛋白质相互作用网络的拓扑结构信息和基因本体的功能注释信息,基于标签传播思想将每个烟花个体初始化为一种候选的功能模块划分.其次在每一代进化过程中,利用具有局部搜索和全局搜索自调整能力的爆炸操作对每个烟花个体进行优化,并同时采用精英保留和轮盘赌策略选择下一代烟花个体.最后通过将最优烟花个体中标签相同的节点划分到同一功能模块,以得到最终的功能模块检测结果.在酵母菌和人类两个物种的4个公共蛋白质相互作用网络数据集上的功能模块检测结果,分别用两种标准功能模块数据集作为基准来评价的实验表明:FWA-FMD算法不但求解时间少于遗传算法、蚁群算法和细菌觅食算法,而且在多项评价指标上与一些代表性算法相比都具有明显的优势,能够更好地识别功能模块.  相似文献   

11.
Location based social networks (LBSNs) provide location specific data generated from smart phone into online social networks thus people can share their points of interest (POIs).POI collections are complex and can be influenced by various factors,such as user preferences,social relationships and geographical influence.Therefore,recommending new locations in LBSNs requires to take all these factors into consideration.However,one problem is how to determine optimal weights of influencing factors in an algorithm in which these factors are combined.The user similarity can be obtained from the user check-in data,or from the user friend information,or based on the different geographical influences on each user's check-in activities.In this paper,we propose an algorithm that calculates the user similarity based on check-in records and social relationships,using a proposed weighting function to adjust the weights of these two kinds of similarities based on the geographical distance between users.In addition,a non-parametric density estimation method is applied to predict the unique geographical influence on each user by getting the density probability plot of the distance between every pair of user's check-in locations.Experimental results,using foursquare datasets,have shown that comparisons between the proposed algorithm and the other five baseline recommendation algorithms in LBSNs demonstrate that our proposed algorithm is superior in accuracy and recall,furthermore solving the sparsity problem.  相似文献   

12.
在无先验知识的前提下,复杂网络聚簇需确定簇数并精确地将节点分配到其所属簇,而大部分传统聚簇方法无法自动确定簇数。为解决这一问题,结合GEP和信息论聚类框架,提出了复杂网络自动聚簇算法——AutoC-NC-GEP。算法为复杂网络聚簇建立了GEP结构模型,设计了有效的遗传算子,提出了"不完全聚簇划分"概念,并分别以Map Eqation和Modularity两种不同的网络社团结构量化函数为适应度函数,使用真实网络对算法的聚簇性能进行了测试。实验结果表明,在没有先验知识的前提下,AutoCNC-GEP算法不仅能正确解析网络的社团数量,还可以自动将节点精确地分配到其所属社团中,从而获得网络的最佳社团结构。  相似文献   

13.
社团结构是复杂网络的重要特征之一,寻找网络中的社团对于分析整个网络的结构和功能都有非常重要的意义.综述了一些经典的复杂网络社团结构划分的算法,提出了一种基于集合扩充的社团结构划分的新算法.该算法以网络中相邻的两个节点构成的集合为起点,用社团同外部联系的边的数目与社团内部边的数目的比值作为度量指标,通过计算将某一个邻居节点加入该集合后度量指标值的变化情况来判断某个邻居节点是否加入该集合,若度量指标值变小则将该邻居节点加入该集合,若度量指标值变大则不将该邻居节点加入该集合,直到不再有新的邻居节点加入时,一个社团就被划分出来.在剩下的网络中重复这个过程直到网络中的节点完全被划分.用社团结构分解中的两个经典例子测试了该算法,从测试结果来看,用该方法能够合理地划分网络中的社团结构,且运算量小,运行效率高,达到了预期目标.该社团结构的划分方法对于规模较大的复杂网络也具有普遍意义.  相似文献   

14.
基于拓扑势的网络社区结点重要度排序算法   总被引:1,自引:0,他引:1  
针对经典网络社区划分方法存在的划分结果难以理解的问题,基于源自物理学中核子场的拓扑势理论,提出针对具有聚类效应的社会网络和复杂网络的社区结点重要度排序算法.在算法中,首先利用NSP方法(network soft partition based on topological potential)依据结点在社区中所起的作用将其分为内部结点和边界结点,其次分别对内部结点和边界结点的重要性进行量化并排序,最后将2个排序结果进行拼接以构成最终的排序结果.实验表明,文中算法不但可以解决前述问题,而且具有和快速排序算法同样的时间复杂度.  相似文献   

15.
揭示未知蛋白质功能是后基因时代蛋白质组学中的核心内容之一,运用群集智能思想识别蛋白质相互作用网络(protein-protein interaction network, PPIN)中的功能模块已经成为该领域的一个研究热点。提出一种基于花授粉算法(flower pollination algorithm, FPA)的蛋白质相互作用网络功能模块检测方法(FPA for functional module detection in PPIN, FPA-FMD)。采用随机游走的方式对种群中的每个花粉进行编码,并利用花授粉算法特有的自花授粉和异花授粉机制优化种群,其中自花授粉采用重组策略和取优策略,异花授粉采用基于Levy机制的变异策略和基于差异度的自适应变异策略,4种策略分别从不同角度推进了种群的进化。在3个公共数据集上的仿真试验表明:与其他6种经典算法相比,本研究提出的算法的整体性能优良而且在F度量和准确度两项综合指标上具有绝对优势。  相似文献   

16.
基于模块化神经网络的轴承故障判断方法   总被引:3,自引:0,他引:3  
提出了一种用于滚动轴承类故障识别的混合模块化神经网络方法.该方法将用于检测故障的过滤网络模块与用于分类的网络模块相组合.首先将不同故障类别轴承的振动信号形成的特征向量经过滤模块,用改进的BP算法判断有无故障,然后经分类网络模块确定其所属故障类型.分类模块中的网络结构则通过对每类故障独立训练形成.实验结果证明,与单一神经网络学习及判断结果相比较,本文提出的方法准确率更高,实用性更强.  相似文献   

17.
Location based social networks (LBSNs) provide location specific data generated from smart phone into online social networks thus people can share their points of interest (POIs).POI collections are complex and can be influenced by various factors,such as user preferences,social relationships and geographical influence.Therefore,recommending new locations in LBSNs requires to take all these factors into consideration.However,one problem is how to determine optimal weights of influencing factors in an algorithm in which these factors are combined.The user similarity can be obtained from the user check-in data,or from the user friend information,or based on the different geographical influences on each user's check-in activities.In this paper,we propose an algorithm that calculates the user similarity based on check-in records and social relationships,using a proposed weighting function to adjust the weights of these two kinds of similarities based on the geographical distance between users.In addition,a non-parametric density estimation method is applied to predict the unique geographical influence on each user by getting the density probability plot of the distance between every pair of user's check-in locations.Experimental results,using foursquare datasets,have shown that comparisons between the proposed algorithm and the other five baseline recommendation algorithms in LBSNs demonstrate that our proposed algorithm is superior in accuracy and recall,furthermore solving the sparsity problem.  相似文献   

18.
最短路算法在交通,通信等领域有非常重要的应用,许多网络问题都可以归结为一个最短路问题.Dijkstra最短路算法是一个非常有效的算法,在计算网络中某一个顶点到其他各顶点的最短路时,如果引入Fibonacci堆,则Dijkstra算法运行所需要的加法及比较次数大致为O(m+nlogn),其中,m,n分别为网络的边数和顶点数.但由于在算法执行过程中,对Fibonacci堆的操作也有一定的代价。本文根据大型稀疏网络的特点,对Dijkstra最短路算法提出了一些非常简单的,但是非常有用的改进,并由此得到一个针对大型稀疏网络的Dijkstra最短路算法,该算法不需要构造Fibonacci堆,并且算法在运行时也只需要加法与比较,其所需要加法和比较的次数为O(m+nlog(n!)),其中D为网络中与顶点相关联边数的最大值.对于大型稀疏网络,如公路交通网络,D通常比较小,因此,所给算法对这类网络是非常有效的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号