共查询到19条相似文献,搜索用时 203 毫秒
1.
基于代理服务器的协作浏览 总被引:1,自引:0,他引:1
1 引言当一个工作组的用户通过WWW代理服务器(ProxyServer)访问Internet时,在Proxy Server的日志内会留下他们的访问记录。其基本访问方式如图1所示。 相似文献
2.
一种新的代理缓存替换策略 总被引:7,自引:0,他引:7
代理缓存的替换策略事实上可以看做排序问题,排序的标准可能有多种,寻找一个好的代理缓存的替换策略就是寻找一个能够反映真实Web访问特性的标准,基于文档大小的替换策略是一种简单实用的策略,但是并未全部利用WWW访问特性,根据在代理缓存日志中对各种访问特性的分析,使用文档大小,访问频率、文档访问剩余寿命作为计算文档价值的要素,提出了一种新的替换策略,这种策略同时具有较高的文档命中率和文档字节命中率,最后给出了基于日志的模拟。 相似文献
3.
网络日志规模分析和用户兴趣挖掘 总被引:32,自引:0,他引:32
文章围绕网络日志中是否蕴含用户访问Web的规律性特性以及如何利用这些特性,研究了日志规模与用户数、Web文档数以及单位用户访问的Web文档数的关系;通过用户对Web访问动机的分析得出结论:一定时间段的Web访问日志中蕴含了用户的稳定兴趣;利用日志中蕴含的用户稳定兴趣,提出了一个基于用户行为的相关文档检索模型和搜索引擎系统SISL SISI的实际检索性能与分析检索模型所得结论一致:检索准确率和检索时间主要依赖于用户数,检索返回的记录数主要依赖于文档数. 相似文献
4.
5.
6.
7.
如何在网页中访问Web数据库 总被引:1,自引:0,他引:1
随着Web应用越来越广泛,WWW页面已经由静态网页逐渐发展成为动态的交互式网页,WWW网页与数据库的连接也显得越来越重要。本文将综合介绍几种在WWW中访问数据的方法。假设数据库服务器的操作系统为WindowsNT Server 4.0,数据库是MicrosoftSQL Server 6.5,其中有一名为Example的数据库,一个名为Student的表,其中存放着年龄、性别等信息,现在讨论如何在网页中访问它。 相似文献
8.
应用多维数据立方体开采Web日志的多维关联规则 总被引:3,自引:0,他引:3
随着WWW应用的高速发展和广泛普及,在WWW民务器上收集了大量的Web日志,这些日志记录了Web用户对Web页面的每一次访问的过程,它是一种宝贵的信息财富.应用多维数据立方体开采Web日志的多维系联规则,可以掌握网络流量、理解用户访问模式,进一步地可利用这些信息来提高Web系统性能、促进对Web站点的系统设计,以及预测未来用户的数量和爱好;最终可以在日益发展的电子商务领域,指导企业明智地进行市场决策。 相似文献
9.
随着WWW的迅猛发展,基于Web的信息量不断的增加,如何从Web挖掘中寻找知识,通过对Web访问模式的数据挖掘研究,探索Web日志的分析流程,并展示它广泛的应用前景。 相似文献
10.
针对仿真生成算法采用静态分布模型生成Web日志,会造成与真实数据之间存在较大差异的问题,提出一种基于用户兴趣迁移的Web日志仿真生成(WLSG)算法。该算法首先对Web日志与时间的关系进行了建模;其次,模拟了用户在不同时间访问文件时用户的兴趣迁移;最后,也模拟了用户自适应访问当前时刻最感兴趣的文件。相对于现有的采用静态分布模型的仿真算法,所提算法能够提高自相似性指标约2.86%。实验结果表明,该算法通过用户的兴趣迁移来改变用户的访问序列,能够较好地模拟真实Web日志,有效地应用于Web日志的仿真生成。 相似文献
11.
12.
13.
Analysis and modeling of World Wide Web traffic for capacity dimensioning of Internet access lines 总被引:1,自引:0,他引:1
A study on traffic characterization of the Internet is essential to design the Internet infrastructure. In this paper, we first characterize WWW (World Wide Web) traffic based on the access log data obtained at four different servers. We find that the document size, the request inter-arrival time and the access frequency of WWW traffic follow heavy-tail distributions. Namely, the document size and the request inter-arrival time follow log-normal distributions, and the access frequency does the Pareto distribution. For the request inter-arrival time, however, an exponential distribution becomes adequate if we are concerned with the busiest hours. Based on our analytic results, we next build an M/G/1/PS queuing model to discuss a design methodology of the Internet access network. The accuracy of our model is validated by comparing with the trace-driven simulation. We also investigate the effect of document caching at the Proxy server on the WWW traffic characteristics. The results show that the traffic volume is actually reduced by the document replacement policies, but the traffic characteristics are not much affected. It suggests that our modeling approach can be applied to the case with document caching, which is demonstrated by simulation experiments. 相似文献
14.
Web代理服务器缓存能够在一定程度上解决用户访问延迟和网络拥塞问题,Web代理缓存的缓存替换策略直接影响缓存的命中率,从而影响网络请求响应的效果;为此,使用一种通过固定大小的循环滑动窗口提取Web日志数据的多项特征,并使用高斯混合模型对Web日志数据进行聚类分析,预测在窗口时间内可能再次访问到Web对象,结合最近最少使用(LRU)算法,提出一种新的基于高斯混合模型的Web代理服务器缓存替换策略;实验结果表明,与传统的缓存替换策略LRU、LFU、FIFO、GDSF相比,该策略有效提高了Web代理缓存的请求命中率和字节命中率。 相似文献
15.
16.
现有的Web缓存器的实现主要是基于传统的内存缓存算法,由于Web业务请求的异质性,传统的替换算法不能在Web环境中有效工作。研究了Web缓存替换操作的依据,分析了以往替换算法的不足,考虑到Web文档的大小、访问代价、访问频率、访问兴趣度以及最近一次被访问的时间对缓存替换的影响,提出了Web缓存对象角色的概念,建立了一种新的基于对象角色的高精度Web缓存替换算法(ORB算法);并以NASA和DEC的代理服务器数据为例,将该算法与LRU、LFU、SIZE、Hybrid算法进行了仿真实验对比,结果证明,ORB算 相似文献
17.
毕利 《计算机应用与软件》2006,23(11):98-100
通过对电子商务中服务器上的日志文件等Web数据进行客户访问信息的分析,重点研究了客户分析系统的数据采集、数据处理以及跟踪客户在Web上的浏览行为并进行模式分析,并构建了用户访问模式的挖掘模型及算法的分析与实现。 相似文献
18.
This paper presents a Page rank-based prefetching technique for accesses to Web page clusters. The approach uses the link structure of a requested page to determine the “most important” linked pages and to identify the page(s) to be prefetched. The underlying premise of our approach is that in the case of cluster accesses, the next pages requested by users of the Web server are typically based on the current and previous pages requested. Furthermore, if the requested pages have a lot of links to some “important” page, that page has a higher probability of being the next one requested. An experimental evaluation of the prefetching mechanism is presented using real server logs. The results show that the Page rank-based scheme does better than random prefetching for clustered accesses, with hit rates of 90% in some cases. 相似文献
19.
In traditional proxy caches,any visited page from any Web server is cached independently,ignoring connections between pages,And users still have to frequently visity in dexing pages just for reaching useful informative ones,which causes significant waste of caching space and unnecessary Web traffic.In order to solve the above problem,this paper introduced a site graph model to describe WWW and a site-based replacement strategy has been built based on it .The concept of “access frequency“ is developed for evaluating whether a Web page is worth being kept in caching space.On the basis of user‘‘‘‘‘‘‘‘s access history,auxiliary navigation information is provided to help him reach target pages more quickly.Performance test results haves shown that the proposed proxy cache system can get higher hit ratio than traditional ones and can reduce user‘‘‘‘‘‘‘‘s access latency effectively. 相似文献