共查询到17条相似文献,搜索用时 171 毫秒
1.
基于高校图书馆Web日志挖掘的分析与研究 总被引:1,自引:0,他引:1
以长江大学图书馆主页服务器Web日志文件为例,介绍了Web日志分析流程、Web日志格式,分析了Web日志挖掘的数据预处理过程,最后给出了应用实例。 相似文献
2.
Web日志挖掘数据预处理方法研究
总被引:1,自引:0,他引:1
柳胜国 《现代图书情报技术》2004,20(12):55-57
Web日志挖掘技术是Web数据挖掘中最重要的应用。通过对挖掘服务器日志文件的分析和研究,可以对网站的组织结构及其性能进行改进,增加个性化服务,发现潜在的读者群体。数据预处理关系到Web日志挖掘的质量。数据预处理包括数据清理、识别用户、识别用户会话、格式化,目的是分割服务器日志为多个独一无二的用户的一次访问序列,并给予了算法实现。 相似文献
3.
Web数据挖掘的原理、方法及用途 总被引:14,自引:0,他引:14
Web数据挖掘是将数据挖掘技术和理论应用于对WWW资源进行挖掘的一个新兴的研究领域,本文介绍了Web数据挖掘的基本概念,分类,并给出Web数据挖掘的基本原理,基本方法,最后指出Web数据挖掘的用途,展望了其美好的发展前景。 相似文献
4.
Web日志数据库数据挖掘对采访决策的意义 总被引:4,自引:0,他引:4
1 高校图书馆采访决策的影响因素高校图书馆的采访原则综合了读者需求、专业分布、当前热点、资金等众多因素,随着图书馆从传统的“藏书型”转变为开放性的“服务型”,读者的需求成了图书馆采访工作所需考虑的最重要的因素。因此,获取和保证读者的需求是图书馆采访工作的出发点和归宿,是制定图书馆采访政策最重要的依据。调查和分析读者需求,形成信息反馈,不仅是对采访工作质量的考核和验证,而且是制定和调整采 相似文献
5.
6.
7.
通过对高校毕业生利用图书馆数据的挖掘,分析每个毕业生在校期间到馆及借阅图书情况,以轻松愉快的方式呈现毕业生个人在校期间的图书馆生活。 相似文献
8.
基于XML的Web日志挖掘研究* 总被引:2,自引:0,他引:2
潘有能 《现代图书情报技术》2006,1(5):62-64
设计一个基于XML的Web日志挖掘体系结构,简要介绍XGMML和LOGML,并在此基础上讨论LOGML文档的生成方法及利用Apriori算法对日志文档进行频繁集、频繁序列和频繁子图挖掘。 相似文献
9.
10.
图书馆Web服务器的选择与配置 总被引:1,自引:0,他引:1
一、Web服务器和网络操作系统的选择 通常,在建立图书馆Web网站时,要考虑硬件平台、操作系统、数据库、Web服务器、Web应用软件等的选择问题.另外,大多数Web服务器主要是为一种操作系统进行优化的,有的只能运行在一种操作系统上,所以选择Web服务器时,还需要同操作系统联系起来考虑. 相似文献
11.
北京大学图书馆的主页日志分析 总被引:2,自引:0,他引:2
张学宏 《现代图书情报技术》2005,21(5):81-83
从分析主页服务器日志的重要性出发,论述了日志分析在图书馆中进行用户分析、主页设计和获得用户反馈等方面的实际价值,并介绍了一次主页日志的分析过程,同时指出了利用日志分析的局限性。 相似文献
12.
数据挖掘在数字图书馆中的应用 总被引:15,自引:0,他引:15
王艳 《现代图书情报技术》2002,18(5):8-10
在描述数据挖掘技术与方法基础之上,探讨了数据挖掘在数字图书馆中的应用空间以及其所具有的巨大应用价值。 相似文献
13.
基于数据挖掘的图书馆读者行为分析 总被引:7,自引:0,他引:7
随着数据库技术的迅速发展以及数据库管理系统在图书馆的广泛应用,在图书馆,积累了大量的读者对资源的历史访问数据。这些数据背后隐藏着许多重要的信息,通过对其进行更高层次的分析,便能更好地利用这些数据为读者服务。 相似文献
14.
贺东鸿 《现代图书情报技术》2004,20(4):53-55
随着集群的广泛应用, 集群管理的重要性显得越来越明显。分析了负载平衡集群服务器的结构和特点。探讨了基于情报信息网络负载平衡的主要技术。网络负载平衡提高了诸如Web 服务器、FTP 服务器和其它关键任务服务器上的服务程序的可用性和可伸缩性。 相似文献
15.
基于Web的电子资源日志分析研究 总被引:1,自引:1,他引:1
指导读更好地利用电子资源是当前图书馆员的一项主要工作,而对基于Web电子资源日志的分析将有助于了解读一些潜在的需求,从而更好地为读服务,因此讨论了对日志分析利用的重要性、可能性和实现的设想。 相似文献
16.
论文针对图书馆日志多数据源且格式多样化导致的日志处理效率低下的问题,提出了基于ELK的日志综合解决方案。该方案首先探讨了日志采集、数据清洗、日志解析的规则和技巧以及基于TF-IDF、SVM算法设计的日志异常检测模型;其次基于提出方案的整体架构,详细地分析了日志采集、存储、可视化、异常检测的整个流程;最后,将该方案应用于中国矿业大学OPAC系统,对读者用户的检索行为、不良用户的攻击行为进行可视化分析。实验结果表明,论文提出的日志管理解决方案,在集群模式下检索性能极其高效,有效地提高了图书馆日志的处理能力。 相似文献
17.
搜索引擎日志挖掘领域的论文合著网络分析 总被引:2,自引:0,他引:2
基于Web of SCI和EI数据库中所收录的有关搜索引擎日志挖掘领域的研究论文,构建作者合著网络,利用社会网络分析方法研究合著网络的中心性、小世界特性、连通性等基本特征,发现该领域中最核心的科研合作团队、研究人员及其研究内容等。 相似文献