首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
基于高校图书馆Web日志挖掘的分析与研究   总被引:1,自引:0,他引:1  
以长江大学图书馆主页服务器Web日志文件为例,介绍了Web日志分析流程、Web日志格式,分析了Web日志挖掘的数据预处理过程,最后给出了应用实例。  相似文献   

2.
数据预处理是Web日志挖掘的基础,而路径补充是数据预处理中一个关键环节。本文运用Petri网来描述Web站点结构,利用Petri网的可达性与关联矩阵等性质完成路径补充。提出了一种基于Petri网模型的路径补充算法,该方法不但可以高效地获得用户的访问路径,而且能够动态的反映用户的浏览行为。  相似文献   

3.
Web数据挖掘的原理、方法及用途   总被引:14,自引:0,他引:14  
Web数据挖掘是将数据挖掘技术和理论应用于对WWW资源进行挖掘的一个新兴的研究领域,本文介绍了Web数据挖掘的基本概念,分类,并给出Web数据挖掘的基本原理,基本方法,最后指出Web数据挖掘的用途,展望了其美好的发展前景。  相似文献   

4.
搜索引擎日志记录了用户与系统交互的整个过程。对日志文件进行挖掘,可以发现用户进行Web搜索的行为特征与规律,有效改善搜索引擎系统的性能。在对国内外相关研究进行系统梳理和总结的基础上,文章提出了一个Web搜索引擎日志挖掘的研究框架,主要包括日志挖掘的研究内容、数据集的选择方法、数据预处理的方法、不同地域用户行为的特征与比较、如何应用于系统性能的改善等内容。  相似文献   

5.
Web数据应用的利器--Web数据挖掘   总被引:1,自引:0,他引:1  
张娥  冯耕中  战子玉 《情报学报》2002,21(6):686-690
Web已经成为世界上最大的信息仓库之一 ,但是随着信息量的增长 ,人们有效使用Web信息也越来越困难。Web数据挖掘为人们使用Web中的显性和隐性信息提供了一把利器。本文介绍了Web挖掘提出的背景、领域内研究分支学科状况、研究内容、研究难点和国内外的研究现状。  相似文献   

6.
基于XML的Web日志挖掘研究*   总被引:2,自引:0,他引:2  
设计一个基于XML的Web日志挖掘体系结构,简要介绍XGMML和LOGML,并在此基础上讨论LOGML文档的生成方法及利用Apriori算法对日志文档进行频繁集、频繁序列和频繁子图挖掘。  相似文献   

7.
前言 为了实现对流媒体系统数据的全面分析,可以通过对流媒体服务器日志数据进行多角度统计分析以及进一步的数据挖掘来获得。同时,还可以使系统的管理者得到系统运行的稳定程度、系统运行性能等数据,以便调整网络和硬件资源。在实际应用时,  相似文献   

8.
作者通过对图书馆业务、图书管理系统的分析研究发现,书目挖掘中的流通日志存在大量的“业务脏数据”.文章介绍了图书管理系统中与书目挖掘相关的数据表之间的关联关系,提出利用表间关联清洗方法实现“业务脏数据”的清洗,进而提高书目挖掘中的数据质量.  相似文献   

9.
Web 用户访问模式挖掘技术可以从服务器、浏览器端的日志记录中自动发现用户的访问偏好、兴趣和趋势等 信息,目前已经成为web 挖掘领域的一个研究热点。文章首先给出Web 访问模式挖掘系统的一般框架模型,然后介绍了 框架模型中主要组成部分的工作原理,在此基础上,对Web 访问模式挖掘系统中的一些关键技术的最新研究进展状况作 了阐述和分析,其中包括数据采集、数据预处理、模式发现、用户可视化界面等,最后分析了未来该领域的研究重点作 了展望。  相似文献   

10.
吕娜 《图书情报工作》2007,51(5):138-141
数字图书馆网站服务系统中存有大量有关用户访问信息的日志文件,通过对这些日志文件的挖掘可以得到有关数字图书馆资源利用情况和用户兴趣的信息。但实际上,这些日志文件很少被利用。针对这一现状,作者对日志文件进行挖掘试验分析,得出用户的频繁下载集合,以用于推荐链接和评价数据库资源。  相似文献   

11.
通过挖掘网络日志中的查询词语义关系,将《知网》的语义知识加入到聚类算法中实现搜索引擎优化。该方法通过机器学习算法深入挖掘查询日志,对其中的查询串进行概念相似度、语义聚类等计算,使返回网页更加合理,将更准确的网页结果呈现在用户面前,能够更好地满足用户需求。  相似文献   

12.
认为移动搜索用户行为特征与规律的发现,对移动搜索服务的改进具有重要的参考价值。基于国内某大型学术类网站一批包含300余万条有效记录的日志数据,分析查询串、搜索时间的分布、搜索会话、移动搜索设备终端等我国移动搜索用户行为的基本特征指标。研究结果显示:与传统PC搜索相比,移动用户的查询时间分布更均匀,会话更短,使用查询推荐比例更少,移动智能终端设备用户搜索更频繁。  相似文献   

13.
试论Web中的数据挖掘   总被引:6,自引:0,他引:6  
随着 Internet/Intranet的迅速发展 ,Web已成为一个巨大的信息源 ,如何有效地利用这些信息变得非常重要 ,本文详细介绍了 Web挖掘技术的概念、分类及实现技术 ,并介绍了一些实用的 Web挖掘工具  相似文献   

14.
Web挖掘技术在电子商务中的应用研究   总被引:16,自引:0,他引:16  
刘培刚 《情报学报》2002,21(6):680-685
本文基于国内外最新研究成果对电子商务中应用的Web挖掘技术进行了研究。对于个性化电子商务网站中难以发现用户行为特征问题 ,给出了基于Web日志的客户群体聚类算法及Web页面聚类算法。利用这些Web挖掘技术可有效挖掘用户个性特征 ,从而指导电子商务网站资源的组织和分配。  相似文献   

15.
线上购物相对线下购物的一个特点是可以将用户的购物过程记录到网站的Web日志中,为研究用户网上行为特征提供必要的数据支持.本文详细介绍了对Web日志数据进行预处理的一系列步骤和方法,并以某出版社网站18天的日志数据为实证,提取出用户的访问路径(访问页面的先后次序),分析路径信息得到用户在不同页面之间访问的转换概率,从而定量地衡量购物流程中各步骤之间的转换率和贡献率,提炼出用户最有可能的前向转换路径和后向转换路径,以期对网站流程优化和商品促销设置提供决策支持.  相似文献   

16.
构建基于Web数据挖掘技术的信息服务系统   总被引:5,自引:0,他引:5  
介绍Web数据挖掘的种类和方法,提出一个基于Web数据挖掘的信息服务系统结构,该结构以数据挖掘模块为中心,处理数据库、智能代理、Web服务器日志和用户接口多数据源的信息,以改善文献情报机构的服务质量。  相似文献   

17.
通过对高校毕业生利用图书馆数据的挖掘,分析每个毕业生在校期间到馆及借阅图书情况,以轻松愉快的方式呈现毕业生个人在校期间的图书馆生活。  相似文献   

18.
吴育芳  陆春华 《晋图学刊》2010,(3):34-36,49
本文在介绍了Web挖掘的基础上,重点分析了Web文本挖掘的概念、过程及其关键技术,包括文本的特征表示与提取、文本的分类与聚类等。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号