共查询到20条相似文献,搜索用时 859 毫秒
1.
针对可疑洗钱识别问题,提出了基于交易网络特征向量中心度量的可疑洗钱行为检测系统.检测系统包含交易数据预处理、特征向量中心度量、时序检测分析三个关键子算法.同时还给出了三种用于检测异常交易行为的度量指标.通过对银行交易数据进行的实验仿真,验证了系统的有效性. 相似文献
2.
3.
针对海量交易数据易遭受干扰,导致推荐信息混乱、不能为用户有效决策基础问题,提出了一种海量交易数据抗干扰推荐算法,首先对交易数据进行决策树全局搜索,获取决策节点的误差率,更新全部历史数据的平均分类准度.然后使用自适应门限变换干扰抑制方法,降低交易数据中的干扰因素,从而提高网络交易数据的抗干扰性,再通过构建待推荐内容信息项目测评矩阵,计算用户相似度及加权平均值,最后融合上述数值,构建出海量交易数据抗干扰推荐模块,并使用用户聚类分析算法对交易数据分组,随后经过协同过滤把有效信息推送给效用度较高的用户.仿真结果证明,本文算法能够有效的对海量交易数据的干扰做出实时的抑制,效率高且推荐数据内容有效. 相似文献
4.
现实社会存在大量复杂网络,随着大数据时代的来临,复杂网络数据规模不断扩大,难以进行算法分析和可视化展示.针对复杂网络小世界、无标度特性,提出基于K-sup稠密子图的复杂网络概要算法,利用三角形在网络中的同质性和传递性发现复杂网络中的稠密子图,结合模块度最大化,将子图中相似的节点归并为超点;运用分层结构存储概要图,并进行可视化显示.该算法能对大规模复杂网络进行有效压缩,保持原网络的性质.在5个真实数据集上进行对比实验,显示出该算法在压缩率、幂率性和平均聚类系数的保持等指标优于已有算法,同时在大规模数据下具有保持网络拓扑结构且支持概要图分层可视化的优点. 相似文献
5.
为了实现在海量数据中的审计线索的快速发现,通过数据挖掘FMA算法对被审数据和审计专家经验库进行关联规则快速提取;再利用自组织神经网络改良CLARANS算法对审计专家经验库抽取的规则划分出相似规则群;然后通过对被审单位关联规则集合和专家经验的相似规则群进行相对强弱、趋近率和价值率的比较,最终得到审计线索集合。 相似文献
6.
7.
针对经济犯罪侦查中线索信息数据量极大、信息质量不高(数据缺失、内容不一致、结构复杂等),并且目前大部分系统都着重于从宏观的角度对数据进行分析统计以及决策,无法针对某个具体领域的案件梳理出线索,找出破案关键的问题,研究了地下钱庄洗钱的交易方式以及交易数据的特点、犯罪网络中的结构特征,提出设计并实现了一个面向地下钱庄洗钱行为的可视化交互分析平台。该平台支持对异构数据的同一化,建立了数据模型以及可视结构,资金链的可视化分析,允许用户交互操作,并结合地下钱庄洗钱的交易特征改进了DBSCAN算法;讨论了该平台的系统框架及其关键技术,并结合实际数据给出了应用实例。该平台能够给予办案人员更直观清晰的思路,提高办案效率。 相似文献
8.
9.
近些年来,网络中的重叠社区检测应用越来越广泛,这极大引起了人们的兴趣。通常重叠社区检测只考虑节点的拓扑结构信息,忽略了节点的属性信息,这可能会遗漏数据间的重要结构。本文提出了一种基于节点拓扑结构和属性相似度的局部社区检测算法。首先,计算出节点与社区之间属性相似度。其次,为挖掘内部紧耦合的社区,计算出能够表示耦合性的模块度增量。最后,通过融合多个已检测到局部社区,计算出隶属矩阵从而获取全局重叠社区结构。在三个有真实社区的数据集上的实验结果从内部指标模块度和与真实社区的比较验证了基于节点拓扑结构和属性相似度的重叠社区检测算法比目前基于节点结构的社区检测算法在效率和有效性上有所提升。 相似文献
10.
该文介绍了当前反洗钱领域中的一些经验,并且提出了一种基于特征向量中心度量的可疑洗钱识别算法,该算法针对可疑洗钱行为中的存在的交易网络进行全局识别。同时,该文提供了一个基于MATLAB的算法仿真。 相似文献
11.
12.
伴随大数据时代的到来,数据快速保序匹配与检索成为众多大数据应用急需解决的关键问题,通过抽象与归约等措施,数据对象可抽象为具有若干属性的点集或序列,从而将数据匹配问题转化为字符或数字序列匹配问题。提出一种基于相似度过滤的数据保序匹配与检索算法,算法分三步:(1)数据转换,基于幅值变化趋势将原始序列转换为二进制,对序列中任何一个字符,通过判断包括其前后邻居在内的三个点的关系定义二进制序列,准确反映相邻三点之间的凸增长(降低)或凹增长(降低)关系;(2)数据归约,为方便候选序列与模式序列之间的相似度计算,运用基于幅度变化比例的数据归约方法,将候选序列与模式序列均归约到固定区间;(3)相似度计算,为区分不同趋势的凸增长(降低)或凹增长(降低)幅度,通过计算候选序列与模式序列对应点之间的差值绝对值之和作为相似度判断依据,提出基于相似度过滤的快速匹配方法,寻找与模式序列变化趋势一致的子序列集合,并按照相似度大小排序。理论分析与实验结果表明:(1)该算法具有亚线性时间复杂度;(2)该算法能有效解决Chhabra等人算法对数据震荡幅度失控的问题,同时解决数据序列与模式序列分段规律但整体不相似的问题;(3)解决了Chhabra等人算法中对匹配序列排序造成的匹配结果疏漏问题。该方法不仅能更准确、更多地匹配出变化趋势一致的子字符串,同时将多个候选子串根据与模式之间的相似度进行排序,为进一步的数据精确检索提供判断依据。 相似文献
13.
针对跨行洗钱犯罪的复杂性和协作性,在中央银行大额支付系统(HVPS)框架内,综合有限信息管理新方法,构建了新型的反洗钱管理模型。该模型采用分布式检测点采集排队队列中的洗钱信息,从而对大额支付系统中的协作洗钱犯罪进行整合的动态跟踪。它采用了基于事件的描述方法记录洗钱犯罪过程,应用灰色关联度算法实现大额支付系统中的多检测点信息融合,通过有限信息发掘出大额支付系统中的异常操作行为,最终应用功率谱估计算法实现洗钱犯罪的快速分析与识别。仿真测试结果证明,该模型与传统的反洗钱管理模型相比,洗钱客户覆盖率和发现精确度超过12%以上,而洗钱事件召回率提高了5%以上。从总体来看,该模型具有较高的信息处理效率和处理精度。 相似文献
14.
《计算机应用》2014,(3)
针对跨行洗钱犯罪的复杂性和协作性,在中央银行大额支付系统(HVPS)框架内,综合有限信息管理新方法,构建了新型的反洗钱管理模型。该模型采用分布式检测点采集排队队列中的洗钱信息,从而对大额支付系统中的协作洗钱犯罪进行整合的动态跟踪。它采用了基于事件的描述方法记录洗钱犯罪过程,应用灰色关联度算法实现大额支付系统中的多检测点信息融合,通过有限信息发掘出大额支付系统中的异常操作行为,最终应用功率谱估计算法实现洗钱犯罪的快速分析与识别。仿真测试结果证明,该模型与传统的反洗钱管理模型相比,洗钱客户覆盖率和发现精确度超过12%以上,而洗钱事件召回率提高了5%以上。从总体来看,该模型具有较高的信息处理效率和处理精度。 相似文献
15.
基于局部信息熵的加权子空间离群点检测算法 总被引:7,自引:0,他引:7
离群点检测作为数据挖掘的一个重要研究方向,可以从大量数据中发现少量与多数数据有明显区别的数据对象,"维度灾殃"现象的存在使得很多已有的离群点检测算法对高维数据不再有效,针对这一问题,提出基于局部信息熵的加权子空间离群点检测算法SPOD,通过对数据对象在各维进行邻域信息熵分析,生成数据对象相应的离群子空间和属性权向量,对离群子空间中的属性赋以较高的权值,进一步提出子空间加权距离等概念,采用基于密度离群点检测的思想,分析计算数据对象的子空间离群影响因子,判断是否为离群点,算法能够有效地适应于高维数据离群点检测,理论分析和实验结果表明算法是有效可行的. 相似文献
16.
为提高数据一致性以及检索效率,提出一种基于聚类算法的多维数据库一致性检测与恢复方法。计算数据指标均值与标准差,标准化处理数据;利用K-means算法衡量不同数据属性的相似特征,建立特征簇,选择聚类特征;通过稀疏图描述数据间关系,利用多级图分割算法获取多个子图,通过凝聚层次聚类方法,判断子图间相似度,设定合并阈值聚类子图,根据聚类结果判断数据库的一致性;针对一致性较差的数据库,采用等价类算法构建恢复模型,实现多维数据库一致性检测与恢复。实验结果证明:所提方法检测速度快,恢复后数据库一致性较好。 相似文献
17.
《软件》2019,(2):173-178
在协同过滤推荐算法中,如果用户-评价矩阵稀疏,共同评价的物品个数少,就很难准确的计算出用户相似度,加上其它实际因素,会使最终的推荐结果与实际结果有很大的差异,推荐效果不佳。本文旨在通过改进算法的计算方式,融入更多实际因素,最终形成更准确的推荐结果集。首先,对数据进行预处理分类,降低冗余数据的计算和矩阵稀疏性。其次,考虑实际推荐中影响用户相似度较大的因素,对用户相似度计算做出改进。然后,通过构造混合推荐函数,在spark分布式计算平台上进行离线和实时计算,减少了计算时间。通过最终的数据训练和结果集的对比,展示了改进后的算法在效率和准确率的提高程度。 相似文献
18.
生物网络比对是分析不同生物间进化关系的重要手段,它可以揭示不同物种间的保守功能并为物种间的注释转移提供重要信息。网络比对与子图同构类似,是一个NP-hard问题。本文提出了一种新的分治与整合策略的生物网络比对算法。首先进行模块划分,并根据已有的比对信息计算模块相似性;然后根据模块间结点的子比对获取候选结果集,最终通过超图匹配获得比对结果。使用已有的比对信息的集体行为预估模块间的相似性,大大提高了模块匹配的效率。基于路径和结点的得分函数保证了模块内结点的相似性。对于不同网络间结点的相似性,分别从结点自身和结点间的差异进行相似性判断。与现有算法相比,本文算法在生物和拓扑指标上均表现最佳。 相似文献
19.
20.
为了解决语义网环境下构件查询的查全查准率问题,本文提出了基于本体相似度构件查询算法。首先介绍了本体的形式化定义和构件的刻面描述方法,用本体语言(OWL)对构件本体进行形式化的描述;然后针对本体的概念相似度理论和构件刻面匹配度公式存在的不足,用构件本体的概念相似度代替公式中的匹配度,对构件刻面匹配度公式进行改进和分析,提出了本体相似度构件查询算法;算法通过计算查询树和构件树各子刻面本体概念的RDF描述相似度和RDF图结构相似度,再由构件本体相似度匹配公式进行相似度的比较,检索出相似度高的构件。实验结果表明,该算法具有理想的查全查准率。 相似文献