首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 859 毫秒
1.
针对可疑洗钱识别问题,提出了基于交易网络特征向量中心度量的可疑洗钱行为检测系统.检测系统包含交易数据预处理、特征向量中心度量、时序检测分析三个关键子算法.同时还给出了三种用于检测异常交易行为的度量指标.通过对银行交易数据进行的实验仿真,验证了系统的有效性.  相似文献   

2.
基于形状分布算法提出了一种加强细节检索的算法。该算法首先将经过预处理的模型分割为N个子模块并分别进行特征提取,然后构造每个子模块的形状分布直方图,最后通过比较子模块的相似度来计算模型的相似度。该算法相比形状分布算法比较准确地计算出了模型间的相似性,有效地提高了细节的分辨,解决了外形相近但细节不同的问题。  相似文献   

3.
蔡娟 《计算机仿真》2021,38(6):311-314,438
针对海量交易数据易遭受干扰,导致推荐信息混乱、不能为用户有效决策基础问题,提出了一种海量交易数据抗干扰推荐算法,首先对交易数据进行决策树全局搜索,获取决策节点的误差率,更新全部历史数据的平均分类准度.然后使用自适应门限变换干扰抑制方法,降低交易数据中的干扰因素,从而提高网络交易数据的抗干扰性,再通过构建待推荐内容信息项目测评矩阵,计算用户相似度及加权平均值,最后融合上述数值,构建出海量交易数据抗干扰推荐模块,并使用用户聚类分析算法对交易数据分组,随后经过协同过滤把有效信息推送给效用度较高的用户.仿真结果证明,本文算法能够有效的对海量交易数据的干扰做出实时的抑制,效率高且推荐数据内容有效.  相似文献   

4.
现实社会存在大量复杂网络,随着大数据时代的来临,复杂网络数据规模不断扩大,难以进行算法分析和可视化展示.针对复杂网络小世界、无标度特性,提出基于K-sup稠密子图的复杂网络概要算法,利用三角形在网络中的同质性和传递性发现复杂网络中的稠密子图,结合模块度最大化,将子图中相似的节点归并为超点;运用分层结构存储概要图,并进行可视化显示.该算法能对大规模复杂网络进行有效压缩,保持原网络的性质.在5个真实数据集上进行对比实验,显示出该算法在压缩率、幂率性和平均聚类系数的保持等指标优于已有算法,同时在大规模数据下具有保持网络拓扑结构且支持概要图分层可视化的优点.  相似文献   

5.
景波  刘莹  陈耿 《计算机工程与应用》2014,(22):154-157,179
为了实现在海量数据中的审计线索的快速发现,通过数据挖掘FMA算法对被审数据和审计专家经验库进行关联规则快速提取;再利用自组织神经网络改良CLARANS算法对审计专家经验库抽取的规则划分出相似规则群;然后通过对被审单位关联规则集合和专家经验的相似规则群进行相对强弱、趋近率和价值率的比较,最终得到审计线索集合。  相似文献   

6.
对于识别洗钱交易中钱庄账户的方法、现有公安办案方法与现有研究基于机器预警方法存在准确度低且滞后的问题,本文分析洗钱犯罪集团中钱庄与客户的交易行为特点,从主体背景属性、交易统计量、交易网络、交易行为离群4种角度提取一系列特征进行刻画,并通过随机森林进行特征选择与优化,在已经标注过的数据上进行模型训练与验证,形成一个能够对参与洗钱交易者身份进行自动识别的应用。通过实际数据验证可以发现有严重危害的钱庄经营者。  相似文献   

7.
针对经济犯罪侦查中线索信息数据量极大、信息质量不高(数据缺失、内容不一致、结构复杂等),并且目前大部分系统都着重于从宏观的角度对数据进行分析统计以及决策,无法针对某个具体领域的案件梳理出线索,找出破案关键的问题,研究了地下钱庄洗钱的交易方式以及交易数据的特点、犯罪网络中的结构特征,提出设计并实现了一个面向地下钱庄洗钱行为的可视化交互分析平台。该平台支持对异构数据的同一化,建立了数据模型以及可视结构,资金链的可视化分析,允许用户交互操作,并结合地下钱庄洗钱的交易特征改进了DBSCAN算法;讨论了该平台的系统框架及其关键技术,并结合实际数据给出了应用实例。该平台能够给予办案人员更直观清晰的思路,提高办案效率。  相似文献   

8.
《软件》2017,(12):193-196
在大数据环境下会不可避免的存在一些脏数据,严重的影响了数据质量,而数据清洗是提高数据质量的重要方法,对数据清洗框架的研究可以帮助大数据的系统决策。提出了一个大数据环境下数据清洗的一般框架,并对核心的数据清洗模块中的三个子模块进行详细的分析,包括不完整数据清洗子模块、不一致数据修复子模块和相似重复记录数据清洗子模块,且讨论了其清洗的具体流程。  相似文献   

9.
近些年来,网络中的重叠社区检测应用越来越广泛,这极大引起了人们的兴趣。通常重叠社区检测只考虑节点的拓扑结构信息,忽略了节点的属性信息,这可能会遗漏数据间的重要结构。本文提出了一种基于节点拓扑结构和属性相似度的局部社区检测算法。首先,计算出节点与社区之间属性相似度。其次,为挖掘内部紧耦合的社区,计算出能够表示耦合性的模块度增量。最后,通过融合多个已检测到局部社区,计算出隶属矩阵从而获取全局重叠社区结构。在三个有真实社区的数据集上的实验结果从内部指标模块度和与真实社区的比较验证了基于节点拓扑结构和属性相似度的重叠社区检测算法比目前基于节点结构的社区检测算法在效率和有效性上有所提升。  相似文献   

10.
该文介绍了当前反洗钱领域中的一些经验,并且提出了一种基于特征向量中心度量的可疑洗钱识别算法,该算法针对可疑洗钱行为中的存在的交易网络进行全局识别。同时,该文提供了一个基于MATLAB的算法仿真。  相似文献   

11.
现存的文档相似性算法虽然能够获得2篇文档的相似度,但不能判断出重复或最相似子内容的位置。为此,提出一种基于粒子群优化(PSO)的文档内部子内容的查重算法。利用PSO方法查找2篇文档中最佳相似子内容的位置和长度,设计一种相关函数来判断字符串之间的相似程度,从而得到粒子群的评估函数。测试表明,该查重算法能够快速准确地确定出重复或最相似子内容的位置与长度。  相似文献   

12.
伴随大数据时代的到来,数据快速保序匹配与检索成为众多大数据应用急需解决的关键问题,通过抽象与归约等措施,数据对象可抽象为具有若干属性的点集或序列,从而将数据匹配问题转化为字符或数字序列匹配问题。提出一种基于相似度过滤的数据保序匹配与检索算法,算法分三步:(1)数据转换,基于幅值变化趋势将原始序列转换为二进制,对序列中任何一个字符,通过判断包括其前后邻居在内的三个点的关系定义二进制序列,准确反映相邻三点之间的凸增长(降低)或凹增长(降低)关系;(2)数据归约,为方便候选序列与模式序列之间的相似度计算,运用基于幅度变化比例的数据归约方法,将候选序列与模式序列均归约到固定区间;(3)相似度计算,为区分不同趋势的凸增长(降低)或凹增长(降低)幅度,通过计算候选序列与模式序列对应点之间的差值绝对值之和作为相似度判断依据,提出基于相似度过滤的快速匹配方法,寻找与模式序列变化趋势一致的子序列集合,并按照相似度大小排序。理论分析与实验结果表明:(1)该算法具有亚线性时间复杂度;(2)该算法能有效解决Chhabra等人算法对数据震荡幅度失控的问题,同时解决数据序列与模式序列分段规律但整体不相似的问题;(3)解决了Chhabra等人算法中对匹配序列排序造成的匹配结果疏漏问题。该方法不仅能更准确、更多地匹配出变化趋势一致的子字符串,同时将多个候选子串根据与模式之间的相似度进行排序,为进一步的数据精确检索提供判断依据。  相似文献   

13.
针对跨行洗钱犯罪的复杂性和协作性,在中央银行大额支付系统(HVPS)框架内,综合有限信息管理新方法,构建了新型的反洗钱管理模型。该模型采用分布式检测点采集排队队列中的洗钱信息,从而对大额支付系统中的协作洗钱犯罪进行整合的动态跟踪。它采用了基于事件的描述方法记录洗钱犯罪过程,应用灰色关联度算法实现大额支付系统中的多检测点信息融合,通过有限信息发掘出大额支付系统中的异常操作行为,最终应用功率谱估计算法实现洗钱犯罪的快速分析与识别。仿真测试结果证明,该模型与传统的反洗钱管理模型相比,洗钱客户覆盖率和发现精确度超过12%以上,而洗钱事件召回率提高了5%以上。从总体来看,该模型具有较高的信息处理效率和处理精度。  相似文献   

14.
针对跨行洗钱犯罪的复杂性和协作性,在中央银行大额支付系统(HVPS)框架内,综合有限信息管理新方法,构建了新型的反洗钱管理模型。该模型采用分布式检测点采集排队队列中的洗钱信息,从而对大额支付系统中的协作洗钱犯罪进行整合的动态跟踪。它采用了基于事件的描述方法记录洗钱犯罪过程,应用灰色关联度算法实现大额支付系统中的多检测点信息融合,通过有限信息发掘出大额支付系统中的异常操作行为,最终应用功率谱估计算法实现洗钱犯罪的快速分析与识别。仿真测试结果证明,该模型与传统的反洗钱管理模型相比,洗钱客户覆盖率和发现精确度超过12%以上,而洗钱事件召回率提高了5%以上。从总体来看,该模型具有较高的信息处理效率和处理精度。  相似文献   

15.
基于局部信息熵的加权子空间离群点检测算法   总被引:7,自引:0,他引:7  
离群点检测作为数据挖掘的一个重要研究方向,可以从大量数据中发现少量与多数数据有明显区别的数据对象,"维度灾殃"现象的存在使得很多已有的离群点检测算法对高维数据不再有效,针对这一问题,提出基于局部信息熵的加权子空间离群点检测算法SPOD,通过对数据对象在各维进行邻域信息熵分析,生成数据对象相应的离群子空间和属性权向量,对离群子空间中的属性赋以较高的权值,进一步提出子空间加权距离等概念,采用基于密度离群点检测的思想,分析计算数据对象的子空间离群影响因子,判断是否为离群点,算法能够有效地适应于高维数据离群点检测,理论分析和实验结果表明算法是有效可行的.  相似文献   

16.
为提高数据一致性以及检索效率,提出一种基于聚类算法的多维数据库一致性检测与恢复方法。计算数据指标均值与标准差,标准化处理数据;利用K-means算法衡量不同数据属性的相似特征,建立特征簇,选择聚类特征;通过稀疏图描述数据间关系,利用多级图分割算法获取多个子图,通过凝聚层次聚类方法,判断子图间相似度,设定合并阈值聚类子图,根据聚类结果判断数据库的一致性;针对一致性较差的数据库,采用等价类算法构建恢复模型,实现多维数据库一致性检测与恢复。实验结果证明:所提方法检测速度快,恢复后数据库一致性较好。  相似文献   

17.
《软件》2019,(2):173-178
在协同过滤推荐算法中,如果用户-评价矩阵稀疏,共同评价的物品个数少,就很难准确的计算出用户相似度,加上其它实际因素,会使最终的推荐结果与实际结果有很大的差异,推荐效果不佳。本文旨在通过改进算法的计算方式,融入更多实际因素,最终形成更准确的推荐结果集。首先,对数据进行预处理分类,降低冗余数据的计算和矩阵稀疏性。其次,考虑实际推荐中影响用户相似度较大的因素,对用户相似度计算做出改进。然后,通过构造混合推荐函数,在spark分布式计算平台上进行离线和实时计算,减少了计算时间。通过最终的数据训练和结果集的对比,展示了改进后的算法在效率和准确率的提高程度。  相似文献   

18.
刘晓  陈璟    王子祥 《智能系统学报》2022,17(5):960-968
生物网络比对是分析不同生物间进化关系的重要手段,它可以揭示不同物种间的保守功能并为物种间的注释转移提供重要信息。网络比对与子图同构类似,是一个NP-hard问题。本文提出了一种新的分治与整合策略的生物网络比对算法。首先进行模块划分,并根据已有的比对信息计算模块相似性;然后根据模块间结点的子比对获取候选结果集,最终通过超图匹配获得比对结果。使用已有的比对信息的集体行为预估模块间的相似性,大大提高了模块匹配的效率。基于路径和结点的得分函数保证了模块内结点的相似性。对于不同网络间结点的相似性,分别从结点自身和结点间的差异进行相似性判断。与现有算法相比,本文算法在生物和拓扑指标上均表现最佳。  相似文献   

19.
针对现有的基于kNN近邻协同过滤技术,在选择最近邻居时过于依赖评分相似度的问题,提出了一种用户属性加权活跃近邻的协同过滤算法。首先,通过引入用户特征属性并融合最小权重相似度,根据所得的最终相似度生成目标用户的kNN近邻集。然后,从对目标项目已有反馈信息的用户中生成目标项目的活跃用户子群体,并筛选出kNN近邻集中的活跃用户子群体作为目标用户的活跃近邻集,最终产生评分预测。在公开数据集上的实验结果表明,该算法能有效的提高推荐算法的推荐准确度,具有更好的稳定性。  相似文献   

20.
基于本体相似度的构件查询算法研究   总被引:1,自引:0,他引:1       下载免费PDF全文
为了解决语义网环境下构件查询的查全查准率问题,本文提出了基于本体相似度构件查询算法。首先介绍了本体的形式化定义和构件的刻面描述方法,用本体语言(OWL)对构件本体进行形式化的描述;然后针对本体的概念相似度理论和构件刻面匹配度公式存在的不足,用构件本体的概念相似度代替公式中的匹配度,对构件刻面匹配度公式进行改进和分析,提出了本体相似度构件查询算法;算法通过计算查询树和构件树各子刻面本体概念的RDF描述相似度和RDF图结构相似度,再由构件本体相似度匹配公式进行相似度的比较,检索出相似度高的构件。实验结果表明,该算法具有理想的查全查准率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号