首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对高校的信息资源检索的命中率低问题提出了运用Web使用记录挖掘的高校图书馆搜索引擎。通过采用Web使用记录挖掘技术和Clementine对高校图书馆网站的Web访问日志记录进行挖掘。在Web使用记录挖掘流程中,提出一个基于用户IP、登陆时间、网站的拓扑图、引用网页和Agent来识别出单个用户的新算法,获得有效提高识别用户的实验结果。最后用路径分析来挖掘模式,优化网站结构,从而提高高校图书馆搜索引擎的命中率。  相似文献   

2.
随着互联网的飞速发展,互联网和人们日常的生活、工作、学习等各方面的结合越来越紧密,为使互联网更好的服务于用户(通过Web个性化服务等方式),首先需要了解用户使用互联网的规律性特点,基于Web日志的Web用户行为模式挖掘能解决此问题.目前,Web用户行为模式挖掘仍然是一个新兴的研究领域,其中包含若干需要解决的问题.针对这些问题,在该领域已开展了大量的研究工作.从模式挖掘合理性、模式挖掘结构体系、模式挖掘过程三个方面对Web用户行为模式挖掘中关键问题的研究现状进行了介绍:Web日志中包含了用户访问互联网的一些规律性特征,这些特征可通过Web用户行为模式挖掘的方法得到;为改进模式挖掘、应用的效果,可以采用改进的挖掘结构比如结合内容、结构挖掘的整合结构;Web用户行为模式挖掘过程分为数据预处理、模式挖掘、模式应用三个阶段,这是一个正在发展的研究领域.  相似文献   

3.
Web挖掘是在传统数据挖掘技术的基础上产生的,是从Web上的数据中发现用户的浏览模式或寻找相关的Web页面等。本文首先介绍了Web挖掘的一般知识,然后分析了Web数据挖掘的常用技术,最后讨论了该技术在各领域的应用。  相似文献   

4.
许芳  李媛 《信息技术》2016,(4):193-195,200
大数据背景下,Web使用挖掘的目的是通过识别Web数据使用模式更好地为Web应用需求提供服务,高效地处理大数据并从中找到有用的信息,数据预处理是保证Web使用挖掘数据质量的必要阶段。首先,论述了Web使用挖掘数据预处理领域的相关工作;其次提出了在数据挖掘开始之前的接入流数据预处理技术,这项技术能通过识别单独用户和会话来提高数据预处理的性能;最后进行了实验验证。结果表明,文中方法有助于发现来自于用户数据流的有意义的模式和关系,因此具有可行性和有效性。  相似文献   

5.
基于Web使用模式挖掘的个性化电子商务策略   总被引:1,自引:0,他引:1  
徐嘉莉  付平 《信息技术》2005,29(10):65-68
电子青务是新兴的现代商业模式,Web数据挖掘是先莲的信息处理技术。随着商业信息和数据的急剧增加,如何有效地分析和利用信息成为企业共同关注的问题。本文介绍了Web数据挖掘技术的定义、应用流程以及几种主要技术,并对Web使用模式挖掘在个性化电子商务中的客户细分、驻留客户、站点改进和交叉销售等应用策略进行了探讨。  相似文献   

6.
随着Internet的迅速普及和互联网上信息量的大量增加,个性化的信息需求也随之巨增,Web使用挖掘已成为实现个性化信息服务的一个关键技术。讨论了个性化服务的基本特征,并基于这种特征分析了Web使用挖掘在网络环境下个性化信息服务中所起的作用,还讨论了基于Web使用挖掘的Web个性化技术。针对个性化系统的功能介绍相关预处理技术及其在个性化系统中的应用。  相似文献   

7.
基于Web使用数据挖掘的个性化推荐系统设计   总被引:1,自引:0,他引:1  
Web使用挖掘是实现个性化推荐系统的有效途径。通过对网站日志数据进行挖掘发现频繁访问模式,再结合活动用户的访问页面序列来实现个性化的在线推荐。本文从体系架构及功能模块两个方面进行分析,提出了基于Web使用数据挖掘的个性化推荐系统架构。它包括三个方面:数据预处理、频繁访问路径挖掘及在线推荐。  相似文献   

8.
Web数据挖掘研究与探讨   总被引:18,自引:0,他引:18  
随着WWW迅猛发展,WWW上的信息量不断增加,如何在这些信息中找到用户真正需要的内容,成为数据组织和Web相关领域专家学者关注的焦点。由Web数据具有的半结构化特性,使得Web数据挖掘更加复杂,不同于传统的基于数据库的数据挖掘。为了解决这个问题,把数据挖掘的理论和技术应用于WWW,出现了一个新的研究领域——Web数据挖掘。基于Web的数据挖掘主要分为:Web内容挖掘、Web结构挖掘和Web使用记录的挖掘。综述了基于Web的数据挖掘技术概念与原理,并且介绍用以Web数据挖掘实现的一种全新的技术——XML。如何进一步开发Web数据挖掘,充分利用Web资源,还有待于进一步的研究。Web数据挖掘的研究具有极大的挑战性,同时又具有极大的开发潜力。  相似文献   

9.
一种基于Web日志用户浏览模式的数据挖掘   总被引:1,自引:0,他引:1  
Web日志中包含了大量的用户浏览信息,如何有效地从其中挖掘出用户浏览兴趣模式是一个重要的研究课题.本文研究了Web日志挖掘的机理,在分析挖掘频繁遍历路径的问题特征和对其进行形式化描述的基础上,进一步提出了一种在Web日志中挖掘频繁遍历路径算法,该算法能够正确、快速地从Web日志中抽取频繁遍历路径.  相似文献   

10.
Web数据挖掘研究   总被引:3,自引:0,他引:3  
Web数据挖掘是数据挖掘技术与Web的结合。介绍了Web数据挖掘的概念、Web数据挖掘的流程、Web数据挖掘的分类以及3类Web数据挖掘的应用问题。  相似文献   

11.
基于孟然论潜在语义分析的Web使用挖掘   总被引:2,自引:2,他引:0  
Web使用挖掘的首要任务是发现Web用户访问行为的模式.传统聚类算法对解空间的搜索带有盲目性和缺乏语义特征.提出了一种基于盖然论潜在语义分析(PLSA)的发现和分析Web访问模式的方法,即通过定量地衡量出Web用户和Web对象与潜在因素之间的概率关系,再利用盖然论的方法来完成各种分析任务.实验结果表明该方法具有高效性.  相似文献   

12.
基于数据挖掘的Web服务器攻击检测   总被引:1,自引:0,他引:1  
随着Web技术的飞速发展,越来越多的单位使用Web方式为用户提供服务,黑客的矛头也逐渐转向了Web服务器。文中研究了如何使用数据挖掘的方法对Web服务器日志进行安全性分析,从而快速发现攻击,并针对Web服务器日志特有的格式,对现有的基于相似系数的异常点检测算法进行了改进,使其符合研究的要求,同时构建了两个安全性分析的数据挖掘模型。通过对现有Web日志记录的挖掘,验证了所述方法的可行性。  相似文献   

13.
Web数据挖掘技术研究   总被引:5,自引:0,他引:5  
Web数据挖掘就是利用数据挖掘技术从网络文档和服务中发现和提取信息。Web数据挖掘是一种新兴的边缘科学技术,他涉及到机器学习、数据挖掘、信息检索、自然语言处理、数据库以及人工智能等技术,可用于网络检索、网站建设以及电子商务等方面。根据数据挖掘对象的不同可以将Web数据挖掘分为3类:Web内容挖掘、Web结构挖掘和Web访问信息挖掘。  相似文献   

14.
Web日志挖掘是Web数据挖掘的一个重要研究领域。Web日志挖掘通过发现Web日志中用户的访问规律和模式,可以提取出其中潜在的规律和信息,人们对这个领域的研究也日益重视。然而,传统的基于关联规则的Web日志挖掘算法都是基于所有关联规则的。这种方式往往挖掘产生大量的候选规则,而且存在大量冗余的规则。提出了一种新的无冗余的Web日志挖掘算法,该算法通过引入频繁闭项集合最小关联规则的概念,从而解决了以往基于所有关联规则挖掘算法中出现的上述问题。  相似文献   

15.
对Web日志中用户访问数据的挖掘可以很好的获得系统优化的信息,方便Web站点走向个性化、智能化道路。本文深入了解了Web日志格式的内容,研究了进行Web日志挖掘的一般流程。采取预处理的方式来获得用户有用信息,经过数据清理、用户识别、用户会话识别、界面过滤、路径补充来完成信息的有效汲取,最终通过模式发现和模式分析来完成对使用者感兴趣信息的传送工作,将Web日志挖掘技术真正应用在站点优化进程中。  相似文献   

16.
一个网站有多个网页组成,网站上的信息分布在这些网页上,不同的用户对不同的网页上的信息感兴趣,如何满足用户对敏感网页的高效访问,我们提出一个基于使用挖掘的Web站点个性化信息服务系统来解决问题.利用Web使用挖掘技术来分析用户的浏览模式,根据用户的当前访问需要,自动实时地为用户提供推荐页面,实现个性化服务.  相似文献   

17.
关联规则挖掘是数据挖掘研究领域中的一个重要的方法,旨在挖掘事务数据库中有趣的模式。阐述了Web日志挖掘和关联规则的基本内容,分析了经典Apriori算法的不足之处,提出了改进的算法。另外,利用论坛Web日志数据进行了对比实验,实验结果表明改进后的算法性能有较大提高。将改进后的算法应用于网络论坛的日志挖掘,找出用户的个性化访问模式,从而提高论坛的服务质量。  相似文献   

18.
随着互联网的广泛使用,Web的数据挖掘技术成为现阶段数据挖掘技术研究的重点,但由于其数据挖掘控制的复杂,对人们的数据挖掘和使用带来了困难。而XML数据挖掘的出现弥补了Web数据挖掘的缺陷,为其带来了方便。  相似文献   

19.
本文主要讨论Web数据挖掘技术电子商务领域的应用。介绍了Web挖掘的的基本内容和电子商务中常用的Web数据挖掘技术,分析了Web访问信息挖掘在电子商务中的几点具体的应用。  相似文献   

20.
在Web网络中承载着不同的协议和网络信道,由此产生危险信息,给网络信息空间带来安全威胁,通过对危险Web信息的准确挖掘,可净化网络空间,确保网络安全。传统方法采用模糊关联规则算法进行危险Web信息分类挖掘,在干扰背景下,模糊聚类过容易受到干扰,导致很难建立有效的关联规则,挖掘效率较低。提出一种基于改进关联规则的危险Web信息挖掘技术。在建立关联规则前,引入Takens定理进行危险Web信息数据的相空间重构,构建Web网络的危险信息挖掘的信道模型,并对危险Web信息的信息流多源进程进行分类设计。设计自适应IIR级联滤波算法进行数据干扰滤波,运用以上方法对规则关联过程进行改进,实现危险Web信息的准确挖掘。仿真实验进行了性能验证,结果表明,采用该算法进行危险Web数据挖掘,去干扰性能较好,精度较高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号