首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 953 毫秒
1.
《软件》2016,(1)
网络话题充满噪声,用户在浏览网络的过程中,逐步添加关联性高的网页到话题中,并从话题中删除关联性低的网页,从而形成纯净话题,这就是话题优化的过程。基于此,本文提出一种基于异质图随机游走的模型来模拟用户优化话题的过程,异质图模拟网络内容的关联性,而随机游走模拟用户浏览网络的过程。对于一个网络话题,该模型能够计算出所有网页属于该话题的概率,根据概率分布就能够判断真正属于该话题的网页,从而模拟网络话题优化的过程。仿真结果证实,本文提出的模型可以准确、完整的模拟话题的优化。而通过用户对优化结果的主观评价,同样证实了模型的有效性。  相似文献   

2.
基于用户访问路径分析的网页预取模型   总被引:15,自引:0,他引:15       下载免费PDF全文
许欢庆  王永成 《软件学报》2003,14(6):1142-1147
随着网络信息的飞速增长,互联网已成为人们获取信息的重要来源.但是,受限于网络带宽,用户往往需要忍受较长的访问延时.为了缓解这种情况,人们提出了网页预取技术,用于降低用户的访问延迟,提高Web服务器的服务质量.提出一种基于用户访问路径分析的服务器端网页预取模型.模型通过对用户访问序列进行语义分析,提取路径中蕴含的信息需求,依此进行网页预取决策.为了实现用户访问序列中潜在意图的挖掘,模型还引入了隐马尔可夫模型.性能测试实验的结果表明,该模型具有较好的整体性能.  相似文献   

3.
当今网络中通过网页来种植木马的现象已很普遍。利用网页来传播木马技术就是将木马的域名隐藏在网页里,用户在浏览网页时,隐藏在网页中的木马就会被种植到用户的系统中。因此如果被访问的网页嵌入了木马的域名,那么当网络用户发出链接请求响应时,网络的响应将变得异常。基于上述原因,本文从链接请求响应次数的角度,来判断网页中是否藏有木马域名。首先简介木马技术,网页挂马技术和中介的基本概念,然后给出检测函数y=f(x)以及MMTD在检测木马上的应用,最后给出具体检测算法。  相似文献   

4.
为了增强基于WAP网页的手机广告推荐中用户建模的准确性,并对"非邀"式广告推荐中脱离用户兴趣试探性推荐进行修正,针对手机广告推荐中手机屏幕小、用户注意力集中等特点,根据用户对广告的访问历史和操作模式建立其广告兴趣模型和非兴趣模型,同时分析用户网页访问模式探测其网页兴趣度,在此基础上建立用户综合兴趣模型。分别采用基于网页兴趣模型、基于广告兴趣模型和基于用户综合兴趣模型进行广告推荐,随着样本空间增大,综合兴趣模型的查准率明显优于另两者。实验验证了用户综合兴趣模型在手机广告推荐中的有效性和优越性。  相似文献   

5.
针对Google PageRank算法中存在的“平均分配原则”及网络链接结构所造成的“旧网页问题”、“主题漂移问题”,提出一种改进的网页排序算法N-PageRank.该算法通过对搜索日志进行数据挖掘,捕捉用户与搜索引擎之间的交互过程,发现隐藏在用户搜索行为背后的用户兴趣和搜索规律,利用用户行为反馈模型,分析网络日志里用户的各项行为特点,改善了排序结果的准确率,保证了搜索引擎的返回结果正是用户所希望看到的网页.实验证明该算法有效地降低了网页排序时的客观因素的影响,充分考虑了用户对于网页质量的评价,所得到的排序结果更加能够满足用户的需求.  相似文献   

6.
很多ADSL宽带用户反映通过PPPOE拨号后可以拨上网络,但打开浏览器时却出现无法打开网页的提示。在使用了很多测试方法后发现操作系统正常.问题会出在哪里呢?会不会在ADSL的拨号配置上出现问题呢?在查阅资料后发现用户在ETHERNET300参数的设置上有问题。虽然用户拨号上了网络,但因为没有获得相应的网络路由.所以在浏览网页时提示无法打开网页。  相似文献   

7.
网络用户可以使用浏览器收藏夹收藏网页并快速访问其中内容。基于收藏夹的用户行为研究将对用户个性化、网页质量评估、大规模网页目录构建等方面的工作具有指导意义。该文使用近27万个用户的收藏夹数据,从组织结构、收藏内容和用户兴趣三个方面对用户收藏行为进行了研究。首先,我们提出收藏夹浏览点击模型,分析了收藏夹结构特征和使用效率;其次,通过与PageRank值比较,我们发现用户倾向于收藏质量高的网络资源;最后,我们结合ODP分析了收藏夹用户的兴趣分布特点。  相似文献   

8.
随着网页制作技术的不断发展,越来越多的脚本技术应用于网页之中,不仅减小了网页的规模,更提高了网页浏览的速度,丰富了网页的表现。但同时也给网络安全带来了严重的威胁,黑客们可以利用脚本技术使用户在浏览网页时,破坏用户的操作系统、撒布病毒、盗取用户信息等,网页恶意代码已经成为了影响网络信息安全的最大因素之一。然而目前对恶意代码的防护还大多停留在用户层面,即用户通过在本机安装防病毒软件进行防护,这种方式有着诸多的缺点;本文提出了一种在网络核心层防治恶意代码的解决方案,为恶意代码的防治提供了一种新的解决思路。  相似文献   

9.
毕鹏 《计算机科学》2004,31(Z1):35-37
本文讨论了如何从网页点击次数的统计数据中获得用户对网页中包含信息的评价.在考虑了网页内容,时间等因素对信息价值的影响后,给出了一种基于用户评价的对信息检索结果个性化排序的模型.模型根据用户浏览网页时的行为和用户的特征信息,预测用户对信息的需求,智能地对信息检索结果进行个性化的排序.模型实现简单,可以应用于多数信息检索系统,为用户提供个性化的信息服务.  相似文献   

10.
一种高效的行为定向广告投放算法   总被引:1,自引:0,他引:1  
行为定向广告作为一种新的精准营销手段在近几年逐渐兴起,这种广告模式以其及时、精准、高效的特点备受人们的关注。行为定向广告的主旨是利用用户的网络浏览行为,提供符合用户意图的广告信息,它主要通过分析用户的网页历史访问记录来挖掘有价值的用户行为信息,并针对这种信息投放与之相关的广告。针对行为定向广告问题,提出了一种全新的行为定向广告投放算法,该算法首先根据用户行为特征模型对用户最近访问的网页按主题进行聚类,然后利用用户行为特征分析算法对每一类网页进行行为特征分析并计算该类网页的权重,利用该权重以及该类网页的质心与广告的相似度来计算最后得分,并按照这个得分对广告进行排序从而选出适合该类网页的广告。大量实验表明这是一种高效的行为广告投放算法,有着十分广阔的应用前景。  相似文献   

11.
该文提出了一种从搜索引擎返回的结果网页中获取双语网页的新方法,该方法分为两个任务。第一个任务是自动地检测并收集搜索引擎返回的结果网页中的数据记录。该步骤通过聚类的方法识别出有用的记录摘要并且为下一个任务即高质量双语混合网页的验证及其获取提供有效特征。该文中把双语混合网页的验证看作是有效的分类问题,该方法不依赖于特定领域和搜索引擎。基于从搜索引擎收集并经过人工标注的2 516条检索结果记录,该文提出的方法取得了81.3%的精确率和94.93%的召回率。  相似文献   

12.
结合使用挖掘和内容挖掘的web推荐服务   总被引:10,自引:1,他引:9  
随着Internet的基础结构不断扩大和其所含信息的持续增长,Internet用户越来越感觉容易在WWW服务中“资源迷向”。提高用户访问效率的方法有页面预取技术,站点动态重构技术和web个性化推荐技术等。现有的大多数web个性化推荐技术主要是基于用户使用记录的数据挖掘方法,没有或很少考虑结合页面内容—这才是用户真正感兴趣的。该文提出一种结合用户使用挖掘和内容挖掘的web推荐服务,该推荐服务根据频繁最大前向访问路径,提出含有导航页和内容页的频繁访问路径图概念,根据滑动窗口内的最近用户访问页面内容和候选推荐集中页面内容相关性,来向用户提供个性化推荐服务。经推荐质量分析,这种方法具有较好的推荐优化能力。  相似文献   

13.
This paper provides an empirical characterization of user actions at the web browser. The study is based on an analysis of 4 months of logged client-side data that describes user actions with recent versions of Netscape Navigator. In particular, the logged data allow us to determine the title, URL and time of each page visit, how often they visited each page, how long they spent at each page, the growth and content of bookmark collections, as well as a variety of other aspects of user interaction with the web. The results update and extend prior empirical characterizations of web use. Among the results we show that web page revisitation is a much more prevalent activity than previously reported (approximately 81% of pages have been previously visited by the user), that most pages are visited for a surprisingly short period of time, that users maintain large (and possibly overwhelming) bookmark collections, and that there is a marked lack of commonality in the pages visited by different users. These results have implications for a wide range of web-based tools including the interface features provided by web browsers, the design of caching proxy servers, and the design of efficient web sites.  相似文献   

14.
该文通过对DIV和CSS技术的特点与CSS盒子模型的介绍,解析了采用DIV+CSS进行网页布局能使网页的表现和内容相分离、代码简洁、方便搜索引擎搜索、提高网页传输速率和易于网页的更新与维护等优势。而且通过具体实例给出了DIV+CSS网页布局技术的流程和方法。  相似文献   

15.
网络数据的飞速增长为搜索引擎带来了巨大的存储和网络服务压力,大量冗余、低质量乃至垃圾数据造成了搜索引擎存储与运算能力的巨大浪费,在这种情况下,如何建立适合万维网实际应用环境的网页数据质量评估体系与评估算法成为了信息检索领域的重要研究课题。在前人工作的基础上,通过网络用户及网页设计人员的参与,文章提出了包括权威知名度、内容、时效性和网页外观呈现四个维度十三个因素的网页质量评价体系;标注数据显示我们的网页质量评价体系具有较强的可操作性,标注结果比较一致;文章最后使用Ordinal Logistic Regression 模型对评价体系的各个维度的重要性进行了分析并得出了一些启发性的结论 互联网网页内容和实效性能否满足用户需求是决定其质量的重要因素。  相似文献   

16.
针对目前主题网络爬虫搜索策略难以在全局范围内找到最优解,通过对遗传算法的分析与研究,文中设计了一个基于遗传算法的主题爬虫方案。引入了结合文本内容的PageRank算法;采用向量空间模型算法计算网页主题相关度;采取网页链接结构与主题相关度来评判网页的重要性;依据网页重要性选择爬行中的遗传因子;设置适应度函数筛选与主题相关的网页。与普通的主题爬虫比较,该策略能够获取大量主题相关度高的网页信息,能够提高获取的网页的重要性,能够满足用户对所需主题网页的检索需求,并在一定程度上解决了上述问题。  相似文献   

17.
当我们浏览网页时,在访问速度方面静态网页要明显比动态网页快得多,因此把一些关键性或经常访问的页面使用静态页技术做成静态页至关重要。在介绍什么是静态页生成技术之后分别以发布新闻和首页新闻条目处如何设计为例对静态页的生成作了详细的阐述,其中主要使用了文件对象来完成对文件生成、读取等操作,使用的技术为ASP。  相似文献   

18.
梁广民  王津涛  田坤 《计算机工程与设计》2005,26(5):1170-1172,1219
利用相互独立的多个页面表示数据是Web应用程序的基本特点,这些页面通常需要共同实现某项特定功能。因此,页面之间的参数传递是Web应用程序面临的基本问题。此外,Web应用程序通常都面对大量用户,各用户之间往往需要进行信息传递,其中所使用的关键技术就是数据源接口参数传递算法。针对这一关键技术进行了分析与研究。  相似文献   

19.
在Web日志挖掘的过程中,数据预处理是整个Web日志挖掘过程的基础,其直接影响了日志挖掘的质量和结果.由于目前大多数网页都采用框架模式,而传统的预处理技术并没有针对frame页面进行过滤,即使过滤,也会导致页面结构的混乱,从而不能够为路径补充提供正确的信息.基于此,本文提出一种基于重构网站结构的Web日志挖掘数据预处理方法以及基于它的路径补充方法.  相似文献   

20.
网络时代,几乎每天都有大量的网页掠过人们的眼帘。当然,只有那些有特色的网页才能钩住网民的眼睛,那么,网页是否精彩取决于什么呢?色彩的搭配、文字的变化、图片的处理等,这些当然是不可忽略的因素,除了这些,还有一个非常重要的因素——网页的布局。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号