首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 265 毫秒
1.
李贵  陈成  李征宇  韩子扬  孙平  孙焕良 《计算机科学》2013,40(Z6):141-144,165
提出了一种基于标签路径的Web结构化数据自动抽取方法。该方法通过对网页DOM树的解析获取完整标签路径集合,并依据路径相似度测量方法来聚类标签路径,实现目标数据区域的定位,然后通过标签节点坐标位置的特性来分离各个数据项,过滤冗余数据,最终完成数据抽取。实验结果表明,与MDR方法相比,该方法在处理拥有结构化数据的网页时,有更高的查全率和查准率。  相似文献   

2.
现有协同过滤推荐算法中,存在的评分片面、主观性强、评分矩阵稀疏性等因素影响了推荐的精确度,并在推荐中存在隐私泄露等问题.针对上述问题,提出一种基于混合相似度和差分隐私的协同过滤推荐算法.该算法基于多种相似度进行加权计算构造混合相似度,提高推荐精度;以混合相似度作为质心更新和分类条件,利用改进的K-means算法将与目标用户相似度高的用户进行聚类;采用枚举方法在目标用户集中划分子集,并基于混合相似度构建效用函数,利用差分隐私指数机制在各子集中选择邻居集合,保护用户隐私;最后在邻居集合中选择出评分值最高的项目进行推荐.实验结果表明,该算法在保护用户隐私的同时,有效提高了推荐的精确度.  相似文献   

3.
针对传统协同过滤算法不能及时反应用户的兴趣变化、时效性不足而导致推荐精度不高的问题,提出一种基于用户兴趣和项目属性的协同过滤算法。在传统协同过滤基础上综合考虑评分时间、相似度以及项目属性等因素,首先在计算相似度过程中加入基于时间的用户兴趣度权重函数,然后再与项目属性相似度进行融合,最后进行项目预测与推荐。在Movielens数据集上的实验结果表明,所提出的算法与已有的经典算法相比,平均绝对误差降低了3%~6%,有效提高了推荐的准确性。  相似文献   

4.
将遗传算法用于多路径覆盖测试中是个研究热点,在新旧种群迭代过程中,旧种群中可能包含其他子种群的优秀个体,这部分个体未被充分利用,造成资源浪费;同时,种群中的个体数会远大于可达路径数,而每个个体都会经过某一条可达路径,这样会有多个个体经过同一条路径,导致重复计算个体与目标路径的相似度。基于此,提出结合路径相似表与个体迁移的多路径覆盖测试方法以提高测试效率。通过路径相似表存储已计算得到的路径相似度值,避免该值被重复计算,减少测试时间。在进化过程中,将个体路径与其他目标路径进行比较,若相似度达到阈值,则将此优秀个体迁移至该路径对应的子种群中,提高个体利用率并减少进化代数。由实验可知,该方法与其他六种同类经典方法在八个程序上的平均生成时间降低最高达44.64%,最低为2.64%,平均进化代数降低最高达35.08%,最低为6.13%,故该方法有效地提高了测试效率。  相似文献   

5.
党博  姜久雷 《计算机应用》2016,36(4):1050-1053
针对传统协同过滤推荐算法仅通过使用用户评分数据计算用户相似度以至于推荐精度不高的问题,提出一种改进的协同过滤推荐算法。首先,以用户评分的平均值作为分界点得出用户间的评分差异度,并将其作为权重因子计算基于评分的用户相似度;其次,依据用户项目评分和项目类别信息挖掘用户对项目类别的兴趣度以及用户项目偏好,并以此计算用户偏好相似度;然后,结合上述两种相似度加权产生用户综合相似度;最后,融合传统项目相似度和用户综合相似度进行评分预测及项目推荐。实验结果表明,相对于传统的基于用户评分的协同过滤推荐算法,所提算法在数据集下的平均绝对误差值平均降低了2.4%。该算法可在一定程度上提高推荐算法精度以及推荐质量。  相似文献   

6.
赵洪华  白华利  陈鸣  魏镇韩 《软件学报》2009,20(8):2280-2288
为了提高大规模网络中别名解析的效率,在用traceroute测量得到的IP级网络拓扑的基础上,提出别名过滤的概念.首先从理论上研究别名关系具有的性质,由此提出处理traceroute数据的3个属性;然后提出并设计了别名过滤算法AF(alias filtering)和别名验证算法VAR(validation of alias relationship).最后,利用CAIDA(Cooperative Association for Internet Data Analysis)的Skitter项目得到的中国、日本、韩国这3个国家因特网的traceroute数据集对上述算法进行了验证分析.结果表明,别名过滤的概念非常重要并且文中提出的算法效率比较高.  相似文献   

7.
随着社交网的广泛流行,用户的数量也急剧增加,针对社交网络用户难以在海量用户环境中快速发现其可能感兴趣的潜在好友的问题,各种推荐算法应运而生,协同过滤算法便是其中最为成功的思想。然而目前的协同过滤算法普遍存在数据稀疏性和推荐精度低等问题,为此提出一种基于动态K-means聚类双边兴趣协同过滤好友推荐算法。该算法结合动态K-means算法对用户进行聚类以降低稀疏性,同时提出相似度可信值的概念调整相似度计算方法以提高相似度精度;利用调整后的相似度分别从用户的吸引与偏好两方面计算近邻用户集,综合考虑这两方面近邻对当前用户的择友影响来生成推荐列表。实验证明,相较于基于用户的协同过滤算法,该算法能有效提高系统的推荐精度与效率。  相似文献   

8.
传统的协同过滤推荐算法存在数据稀疏情况下分类准确性低的问题,针对于此提出一种基于改进余弦相似度的协同过滤推荐算法,将数据经嵌入层转换为特征矩阵,将对其计算后得到的改进余弦相似度矩阵和单位矩阵之间的均方误差作为损失函数,从而提高推荐算法在数据稀疏情况下的分类准确性。实验结果表明,该算法的AUC和对数损失函数指标均优于基线模型FM、FFM和DeepFM模型。  相似文献   

9.
余永红  陈兴国  高阳 《计算机科学》2014,41(2):33-35,54
推荐系统根据用户的偏好为用户推荐个性化的信息、产品和服务等,能够帮助用户有效解决信息过载问题。基于内容的协同过滤算法缺少合适的度量指标用来计算项目之间的相似度。提出一种基于耦合对象相似度的项目推荐算法,即通过耦合对象相似度捕获项目特征频率分布相似性和特征依赖聚合相似度。首先从项目文本中抽取项目的关键特征,然后利用耦合对象相似度构建项目相似度模型,最后使用协同过滤的方法为活动用户推荐用户可能感兴趣的项目。在真实数据集上的实验结果表明,基于耦合对象相似度的推荐算法可以有效解决基于内容推荐系统的项目相似度度量问题,在缺失大量项目特征数据的情况下改进传统基于内容推荐系统的推荐质量。  相似文献   

10.
魏镇韩  陈鸣  赵洪华  吉梁 《软件学报》2010,21(9):2387-2394
基于IP路径信息,从分析AS边界的一般模型入手,引入了AS边界序列的概念,提出了一系列AS边界判别规则,这些规则揭示了IP路径信息中所隐藏的AS边界划分规律.由此提出了一种基于规则的AS边界判别方法JBR(judging border by rules).实验结果表明,与基于别名解析的判别方法JBA(judging border by alias)相比,JBR具有较快的判别速度,在边界地址及边界链路的判断上都具有优势.  相似文献   

11.
12.
Internet topology mapping studies utilize large scale topology maps to analyze various characteristics of the Internet. IP alias resolution, the task of mapping IP addresses to their corresponding routers, is an important task in building such topology maps. In this paper, we present a new probe-based IP alias resolution tool called palmtree. Palmtree can be used to complement the existing schemes in improving the overall success of alias resolution process during topology map construction. In addition, palmtree incurs a linear probing overhead to identify IP aliases. The experimental results obtained over Internet2 and GEANT networks as well as four major Internet Service Providers (ISPs) present quite promising results on the utility of palmtree in obtaining more accurate network topology maps.  相似文献   

13.
殷科  邓亚平  唐红 《计算机工程与应用》2005,41(32):123-125,138
随着各种网络应用的发展,路由器必须能够快速完成对IP数据包的分类,以支持如防火墙、QoS等服务。文章分析了多维IP包分类中Hash算法的应用,在此基础上提出了一种基于Hash_tree的多维IP包分类算法。该算法充分发挥了Hash函数查找快速的特点,对IP数据包的分类能够以T位的线速进行处理,同时算法还具有支持较大的匹配规则集、支持增量更新等特点。  相似文献   

14.
IP定位技术通过目标主机的IP地址定位其实际物理地址,被广泛应用于定向广告、在线安全监测、网络攻击溯源等位置相关服务,近年来实体空间资源大量接入网络空间,IP定位受到越来越广泛的关注。本文介绍了IP定位的基本概念和应用场景;根据不同应用场景分析了IP设备的特性;在设备特性基础上,对独立于设备和依赖于设备的两类定位算法进行了介绍和分析;针对不同类型的定位技术,介绍了IP定位中的攻击与防御技术;最后对IP定位技术和防御技术分别进行了综合评估,讨论了未来的发展方向。  相似文献   

15.
王占丰  冯径  邢长友  张国敏  许博 《软件学报》2014,25(7):1527-1540
IP定位技术就是确定Internet中IP设备的地理位置,它可以帮助网络应用改善性能、提高安全性以及提供新的服务.首先概述了IP定位技术的基本概念和应用情况;然后,将现有定位算法分为独立于客户端和基于客户端两类定位算法,并对每一类算法中的典型算法进行了具体分析,讨论了隐私保护技术和新技术的影响;最后,对现有的IP定位算法进行了综合对比,指出了IP定位技术的研究方向.  相似文献   

16.
IP地址地理定位旨在准确地确定给定的IP地址的物理空间位置,通常采用基于测量的技术或者基于数据分析的技术。现有的基于数据分析的IP地址地理定位技术,对IP地址之间的关系考虑较少。考虑到IP地址的聚集特性,提出了一种基于邻近序列的IP地址地理定位方法。首先计算IP地址的邻近序列,并将其转化为对应的经纬度序列,然后建立模型并求解。以IP地址定位库和含有GPS信息的移动流量数据为原始数据,对该方法进行了实验验证。实验结果表明,通过邻近IP序列确实可以确定IP地址的物理空间位置,平均定位误差在20~30km,实现了区县一级的定位。该方法给IP地址地理定位问题提供了新的解决方案,同时该方法也可以与其他基于测量或者基于数据分析的方法相结合,以获得更优的结果。  相似文献   

17.
史怀洲  朱培栋 《计算机工程》2009,35(13):102-104
网络中路由器拓扑发现是研究网络结构和行为的重要基础。路由器多址综合问题是拓扑发现中的一个难题。在总结现有的路由器多址综合解决方法后提出一种新的方法——邻居-子网综合法。与以往方法相比,该方法可信度提高、效率变快,效果更加明显,较好地解决了路由器多址综合问题。  相似文献   

18.
IP geolocation plays a critical role in location-aware network services and network security applications. Commercially deployed IP geolocation databases may provide outdated or incorrect location of Internet hosts due to slow record updates and dynamic IP address assignment by the ISPs. Measurement-based IP geolocation is used to provide real time location estimation of Internet hosts based on network delays. This paper proposes a measurement-based IP geolocation framework that provides location estimation of an Internet host in real time. The proposed frame work models the relationship between measured network delays and geographic distances using segmented polynomial regression model and semidefinite programming for optimization. Weighted and non-weighted schemes are evaluated for location estimation. The proposed framework shows close to 17 and 26 miles median estimation error for nodes in North America and Europe, respectively. The proposed schemes achieve 70-80% improvement in median estimation error comparing to the first order regression approach for experimental data collected from Planet-Lab.  相似文献   

19.
Internet的高速发展要求提供高性能的P流分类算法以更好地为防火墙、QoS、流量工程、资源预留、网络地址转换等提供服务。由于IP报文分类算法的多域特征,因此其具有相当的难度。研究者提出了很多报文分类算法,本文将这些算法概括为5类:基于Trie树的算法、基于空间分割的算法、启发式算法、基于硬件实现的算法和其他算法,并对IP报文分类算法的思想、原理和过程进行了介绍和分析,说明了这些算法之间的联系,并对这些算法在搜索和更新的时间性能、空间性能、适用性范围和优缺点等进行了分析和比较。作为总结,本文还对IP报文分类算法研究的方法和趋势进行了分析和总结。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号