共查询到18条相似文献,搜索用时 78 毫秒
1.
多关系群体挖掘是近年来快速发展的重要的数据挖掘领域之一。传统的群体挖掘方法是假定网络中只有一种关系,并且挖掘结果与用户需求无关。但现实中的社会网络中存在着多种关系。基于用户查询,不同的关系表现出不同的重要性。分析了多关系群体挖掘中关系提取的问题,提出一种新算法对满足用户期望的关系进行最优线性合并。利用获得的合并关系提高群体挖掘的精准性。 相似文献
2.
一种基于用户指导的多关系关联规则挖掘算法 总被引:1,自引:0,他引:1
提出一种基于用户指导的多关系关联规则挖掘算法,对传统的关联规则挖掘方法进行拓展,借鉴元组ID传播的思想使多表间无需物理连接而能直接进行关联规则挖掘,并引入了用户指导的概念,提高了用户的满意程度及挖掘的效率和精确度.该算法能够直接支持关系数据库,且运行时间远远小于基于ILP技术的多关系关联规则挖掘算法. 相似文献
3.
4.
5.
6.
7.
提出和设计了一个基于多数据挖掘算法的农村多发病的辅助诊断系统.该系统提出了分层的诊断知识模型,混合了不同的数据挖掘算法,设计了合理的数据模型.实践证明,该系统具有较理想的数据挖掘效率,为农村医师提供了有力的多发病辅助诊断支持. 相似文献
8.
华梁 《数字社区&智能家居》2011,(7)
针对细菌群体趋药性(Bacterial Colony Chemotaxis,BCC)算法由于过度依赖群体交互而容易陷入局部最优解的缺陷,结合多Agent系统(Multi-Agent System,MAS)的主要特征构造一种全新算法——基于多Agent的细菌群体趋药性(MABCC)算法。该算法通过每个细菌Agent相互之间的竞争与协作,弱化其对群体信息的依赖,使其能够更精确地收敛到全局最优解。对不同函数优化试例的仿真表明该算法比BCC算法有更好的全局寻优性能。 相似文献
9.
挖掘频繁项集是许多数据挖掘任务中的关键问题,也是关联规则挖掘算法的核心,提高频繁项集的生成效率一直是近几年数据挖掘领域研究的热点之一.在对关联规则挖 掘中基于Apriori算法的改进算法进行深入分析和研究后,本文根据Apriori算法的不足,提出了一种改进策略,从而得到一种优化的Apriori算法.最后,对频繁项集挖掘算法的发展方向进行了初步的探讨. 相似文献
10.
在分析研究关系数据库上关联规则挖掘现有方法的基础上,提出了一种基于结构化查询语言SOL的多值多层关联规则挖掘新方法.采用了一种新的根据概念分层的编码方法对多值属性进行离散化,然后利用SOL的查询语句,结合多值属性的编码,实现了关系数据库上的多层关联规则挖掘.实验表踢,该算法具有快速、有效、易开发等优点. 相似文献
11.
入侵检测系统作为一种主动的信息安全防御措施,有效地弥补了传统安全防护技术的不足,利用数据挖掘善于从大量数据中提取有用规则的特点,提出了一种改进的FP-Growth关联分析算法的网络入侵检测防御系统模型,该方法可以极大地提高数据挖掘的速度和节省数据挖掘中数据存储的空间。 相似文献
12.
以新浪微博为研究平台,随机获取微博用户数据作为研究样本,通过共链关系构建社会网络,利用聚类分析方法对样本进行微博关注好友的网络群体分析,网络内部子结构分析和个体角色分析。进而从微博用户好友数据中挖掘关注对象的特征和关注对象间的关联特征,并对改进微博用户关注好友的推荐和信息推送提出一些建议。 相似文献
13.
传统遗传算法应用于社区挖掘时初始种群划分精确度不高,且容易降低算法整体搜索性能。为此,提出一种改进的遗传算法,并将其引入到社区挖掘研究中。结合结构相似度与轮盘赌选择法,使染色体的每个基因趋向于选择结构相似度较大的邻居节点,提高初始种群的社区划分质量并加速算法收敛速度。实验结果表明,在人工基准网络中,该算法的初始种群划分精确度和模块度比传统遗传算法平均提高18%和12%,整体划分精确度比FEC和FN算法平均提高24. 02%和22. 01%,在真实世界网络中,社区划分精确度均优于FN、FEC和LPA算法,从而验证该算法具有较好的社团挖掘性能。 相似文献
14.
为了深入挖掘校园无线网络轨迹行为数据信息,采用基于密度的聚类方法对校园内用户的轨迹行为进行特征聚类。由于基于密度的聚类算法通常采用距离作为相似性度量方式,为了有效衔接此类聚类算法,先将用户相似度矩阵通过转换函数转变为距离矩阵。引入离群点检测算法,将离群点检测算法与聚类算法相结合,减少参数的输入个数,增加聚类的聚合程度。改进后的聚类算法可以有效检测出数据轨迹的异常,帮助高校通过对学生上网记录的处理找到浏览信息与大部分同学不一致的人,缩小目标范围,进行有针对性的处理。通过定性分析和实验对比验证,确定两种基于离群点检测的共享最近邻的快速搜索密度峰值聚类适用于校园无线网络行为轨迹相似度矩阵的处理,邓恩指数等聚类内部指标及整体性能优于同类算法。 相似文献
15.
传统的社区发现算法往往时间复杂度较高,K-means算法作为聚类算法且时间复杂度较低可为社区发现提供新思路,但K-means算法的原始应用场景为数值环境与社交网络不符,且自身存在初始中心节点选取敏感等原有问题,针对上述问题本文在下面三个方面进行了优化:第一,结合最短路径及共同邻居信息重新定义距离度量;第二,结合了节点的度和节点距离因素进行初始中心节点选取;第三,在K-means算法结果的基础上进行基于贪心策略以模块度为目标的层次聚类优化。通过实验表明:改进的K-means算法能够很好地应用于社区发现,得到的社区发现结果有较高质量。 相似文献
16.
LDA作为文本主题识别领域中使用最广泛的模型之一,其基于词袋模型的假设简单化地赋予词汇相同的权重,使得主题分布易向高频词倾斜,影响了识别主题的语义连贯性。本文针对该问题提出一种基于图挖掘的LDA改进算法GoW-LDA,首先基于特征词对在文本中的共现先后关系构建语义图模型,然后利用网络统计特征中节点的加权度,将文本的语义结构特点和关联性以权重修正的形式融入LDA主题建模中。实验结果显示,GoW-LDA相较于传统LDA和基于TF-IDF的LDA,能够大幅降低主题模型的混淆度,提高主题识别的互信息指数,并且有效减少模型的训练时间,为文本主题识别提供了一种新的解决思路。 相似文献
17.
基于改进遗传算法的网络差异数据挖掘算法 总被引:3,自引:0,他引:3
网络差异数据的准确挖掘方法在数据处理领域占据十分重要的地位.利用传统算法进行网络差异数据挖掘,遇到特征相似性干扰时,以模糊规则建立挖掘关联规则,但是,在建立模糊规则时,一旦特征过于接近,需要加入很多约束条件建立规则,导致规则复杂,具有较强的局限性,计算过程较为繁琐.提出了基于混合式遗传算法的网络差异数据挖掘方法,改进原有遗传算法应用的局限性,把模糊理论融合到大变异操作中,形成模糊大变异操作,并利用自适应遗传算法和最佳选择策略机制与过滤操作的思想,将其应用于网络差异数据挖掘中.实验结果证明,基于混合式遗传算法的网络差异数据挖掘方法效率高,精准度高. 相似文献
18.
多关系数据挖掘的研究领域涉及多个学科,它在由多张表构成的关系数据库中进行知识发现。遗传算法是模拟生物的遗传和进化过程而形成的一种自适应全局优化概率搜索算法。该文将遗传算法应用于多关系数据挖掘,组合使用Apriori方法可从多张表中高效地挖掘出有意义的关联规则。 相似文献