首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 62 毫秒
1.
Web用户访问模式挖掘技术可以从服务器、浏览器端的日志记录中自动发现用户的访问偏好、兴趣和趋势等信息,目前已经成为web挖掘领域的一个研究热点.文章首先给出Web访问模式挖掘系统的一般框架模型,然后介绍了框架模型中主要组成部分的工作原理,在此基础上,对Web访问模式挖掘系统中的一些关键技术的最新研究进展状况作了阐述和分析,其中包括数据采集、数据预处理、模式发现、用户可视化界面等,最后分析了未来该领域的研究重点作了展望.  相似文献   

2.
线上购物相对线下购物的一个特点是可以将用户的购物过程记录到网站的Web日志中,为研究用户网上行为特征提供必要的数据支持.本文详细介绍了对Web日志数据进行预处理的一系列步骤和方法,并以某出版社网站18天的日志数据为实证,提取出用户的访问路径(访问页面的先后次序),分析路径信息得到用户在不同页面之间访问的转换概率,从而定量地衡量购物流程中各步骤之间的转换率和贡献率,提炼出用户最有可能的前向转换路径和后向转换路径,以期对网站流程优化和商品促销设置提供决策支持.  相似文献   

3.
通过对使用基于关联规则挖掘方法和聚类用户事务方法进行分析、比较,总结它们的优缺点,认为这两种获取用户个性化模式的方法都可实现提供个性化主动信息服务的目的。  相似文献   

4.
现有的Web用户访问路径信息发现方法大都着眼于从静态的Web日志快照中进行挖掘.本文力图从Web访问数据的历史演变过程中,发现新的知识--持久偏爱的Web用户访问路径PP-WAP.PP-WAP实际上是历史访问序列WAS中大部分时间支持度值波动很小且保持较高的访问路径信息.本文首先介绍了相关背景和PP-WAP的应用领域.接下来,利用无序树结构来表示历史WAS集合,同时给出了PP-WAP的定义和挖掘算法描述.最后,分别针对模拟和实际数据集对算法的可扩展性以及PP-WAP的应用价值作了实验分析.  相似文献   

5.
Web日志挖掘数据预处理方法研究     总被引:1,自引:0,他引:1  
Web日志挖掘技术是Web数据挖掘中最重要的应用。通过对挖掘服务器日志文件的分析和研究,可以对网站的组织结构及其性能进行改进,增加个性化服务,发现潜在的读者群体。数据预处理关系到Web日志挖掘的质量。数据预处理包括数据清理、识别用户、识别用户会话、格式化,目的是分割服务器日志为多个独一无二的用户的一次访问序列,并给予了算法实现。  相似文献   

6.
Web数据应用的利器--Web数据挖掘   总被引:1,自引:0,他引:1  
张娥  冯耕中  战子玉 《情报学报》2002,21(6):686-690
Web已经成为世界上最大的信息仓库之一 ,但是随着信息量的增长 ,人们有效使用Web信息也越来越困难。Web数据挖掘为人们使用Web中的显性和隐性信息提供了一把利器。本文介绍了Web挖掘提出的背景、领域内研究分支学科状况、研究内容、研究难点和国内外的研究现状。  相似文献   

7.
搜索引擎日志记录了用户与系统交互的整个过程。对日志文件进行挖掘,可以发现用户进行Web搜索的行为特征与规律,有效改善搜索引擎系统的性能。在对国内外相关研究进行系统梳理和总结的基础上,文章提出了一个Web搜索引擎日志挖掘的研究框架,主要包括日志挖掘的研究内容、数据集的选择方法、数据预处理的方法、不同地域用户行为的特征与比较、如何应用于系统性能的改善等内容。  相似文献   

8.
Web使用挖掘是利用数据挖掘技术从Web数据中发现用户使用模式的过程。以Web使用挖掘技术为基础,提出了一种个性化服务推荐模型。分析了Web使用挖掘的数据收集、数据预处理、模式发现及分析、个性化服务引擎等过程,并对各过程的个性化服务的实现进行了阐述,还对个性化服务的发展进行了展望。  相似文献   

9.
数据预处理是Web日志挖掘的基础,而路径补充是数据预处理中一个关键环节。本文运用Petri网来描述Web站点结构,利用Petri网的可达性与关联矩阵等性质完成路径补充。提出了一种基于Petri网模型的路径补充算法,该方法不但可以高效地获得用户的访问路径,而且能够动态的反映用户的浏览行为。  相似文献   

10.
王仁武  袁毅 《图书馆论坛》2011,31(4):100-102
用户访问行为信息记录在Web日志中,通过对海量Web日志进行清洗、抽取和加载来构建用户行为数据仓库,并结合文章所提出的用户访问路径概率矩阵模型进行数据挖掘,可以实现智能化的用户行为监控,可以为用户提供及时优质的信息服务。  相似文献   

11.
构建基于Web数据挖掘技术的信息服务系统   总被引:5,自引:0,他引:5  
介绍Web数据挖掘的种类和方法,提出一个基于Web数据挖掘的信息服务系统结构,该结构以数据挖掘模块为中心,处理数据库、智能代理、Web服务器日志和用户接口多数据源的信息,以改善文献情报机构的服务质量。  相似文献   

12.
吴瑞  史文武 《情报学报》2006,25(5):629-633
基于用户访问网页的不同序列反映了用户特定的兴趣,提出了Web日志中用户存取模式的聚类算法。利用传统的Leader算法只扫描数据集一遍的优点,以及粗糙理论在处理含有不确定信息问题上的优势,给出了结合粗糙理论的改进Leader算法对用户存取模式进行聚类方法,使得同一类中的用户存取模式尽可能的相近或相似,不同类中的模式尽可能的相异。实验结果表明,该算法在可承受的计算时间内可对Web日志中的用户存取模式进行有效聚类。  相似文献   

13.
吴育芳  陆春华 《晋图学刊》2010,(3):34-36,49
本文在介绍了Web挖掘的基础上,重点分析了Web文本挖掘的概念、过程及其关键技术,包括文本的特征表示与提取、文本的分类与聚类等。  相似文献   

14.
构建基于读者Web访问行为分析的决策支持系统   总被引:1,自引:0,他引:1  
随着图书馆数字资源的日益丰富,读者访问了哪些资源,对哪些资源感兴趣,图书馆对于纸质文献、数字资源的采购与建设需要科学的决策支持系统来完成。基于图书馆网站访问行为分析成为建立决策支持系统的关键因素。本文在此基础上构建了图书馆的决策支持系统。  相似文献   

15.
以SSCI、IEEE、CNKI、国家自然科学及社会科学基金等为数据源,搜集、整理、统计、分析以Web挖掘为主题的科研论文与科研项目。研究发现:国内外关于Web挖掘研究具有相似的发展轨迹,均经历了萌芽期、发展期、成熟期及回落期;Web挖掘研究重心由早期关注基础理论与基础应用为主,转向以特定领域的特定理论与应用研究的补充与完善为主;大数据、云计算及物联网等新兴技术与Web挖掘的有机融合已成为不可逆转的趋势;Web挖掘研究的主要应用领域发生了很大变化。  相似文献   

16.
web用户聚类对于个性化服务、网站结构优化等具有重要意义。文章从用户的访问路径、项目评分等角度总结了用户聚类方法及算法,指出当前用户聚类研究存在的不足,提出了结合Web挖掘与社会网络分析方法的用户聚类的模型,分析了两者结合的必要性及结合策略,形成较为完善的用户聚类机制。  相似文献   

17.
Web数据挖掘对Web数据检索的支持作用   总被引:3,自引:0,他引:3  
唐建国  胡芒谷 《情报学报》2004,23(4):452-455
本文在对Web数据检索和Web数据挖掘的技术特性进行简要介绍的基础上 ,阐述了二者之间的主要区别 ,并着重对Web数据挖掘对Web数据检索构成的支持作用进行了具体分析。这些支持作用体现在 :自动分类 ,揭示知识特征 ,群集处理 ,超链结构挖掘和用户知识模型挖掘。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号