首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
针对用户访问Web资源时难以获取感兴趣信息的状况,通过分析用户需求,采用优化的矩阵聚类算法,对用户群和页面进行聚类,以理解用户的行为,发现用户的访问模式,从而改善Web服务质量。实验结果表明该方法是可行的,能够更准确的反映网站的访问情况;根据发现用户访问的Web页面的浏览模式,进一步分析和研究Web日志记录中的规律,从而改进Web站点的性能和组织结构,以便Web站点能实现个性化服务。  相似文献   

2.
为了提高网站访问效率并得到有价值的个性化网页推荐,针对Web日志的新特性,提出了一种新的基于竞争凝聚的聚类算法.新算法对K-paths聚类算法进行了扩展和改进,按照路径的相似性进行聚类,采用竞争凝聚的思想,自动确定最佳的聚类数目.由于算法考虑了用户的访问兴趣,个性化网页推荐不打扰用户且不需要用户注册信息.利用关联规则得到个性化网页推荐集.用户推荐集和页面推荐集的结合大大提高了推荐效果,具有较好的扩展性.实验结果表明,与其他聚类方法相比该算法具有更高的推荐精度.  相似文献   

3.
Web日志挖掘中模糊C均值聚类研究   总被引:1,自引:0,他引:1  
Web日志挖掘就是通过一定的方法分析Web日志数据,发现用户的访问习惯,帮助管理人员改进Web站点的性能和结构,提高用户获取知识的质量和速度。笔者首先在Web日志挖掘的背景下分析了模糊C均值聚类算法的缺陷,针对其的不足,在粗糙集理论的支持下,介绍属性信息量的概念,并通过计算待聚类对象的属性权值,区分重要性属性和噪音属性对聚类结果的影响,实验证明该方法提高了模糊C均值聚类算法的准确率。  相似文献   

4.
用户对Web站点的访问代表了用户对Web站点上页面的访问兴趣。这种兴趣程度可以通过用户对Web站点上页面的浏览顺序表现出来。Web站点的访问日志记录了用户访问页面的详细信息。在对Web站点的访问日志进行事务识别后,按照访问兴趣对群体用户对Web站点的访问顺序进行聚类分析,则每一个聚类集反映出该聚类集中的全体用户具有相似的访问兴趣。文中在用户访问兴趣度量中综合考虑用户访问路径、网页内容、在此页面的驻留时间、此页面浏览频度因素,提出了一种基于用户访问兴趣的路径聚类算法。最后通过实验来验证这种算法的有效性。  相似文献   

5.
随着数据挖掘和万维网技术的结合,使得从收集到的访问Internet网页的网站日志记录中执行数据挖掘成为可能。将数据挖掘技术应用于Web日志记录,来发现用户访问Web页面的模式,便形成了Web访问模式挖掘。Web访问模式挖掘是从Web访问日志中挖掘有用的用户访问信息,用于找出头N个用户,头N个被访问页面,最频繁访问时间以及关联模式、序列模式、聚类模式、分类模式和Web访问趋势等,这对于优化站点结构、为不同类别的用户提供个性化服务,有效地实现信息获取和信息推送是非常必要的。Web访问模式挖掘是目前数据挖掘领域的热点,详细论述了Web访问模式挖掘的概念、方法和过程。  相似文献   

6.
Web日志挖掘就是运用数据挖掘的思想来对服务器日志进行分析处理,以发现相似客户群体、相关Web页面和频繁访问路径等,其目的在于从用户访问Web系统的行为中发现用户的访问模式.在对Web日志挖掘的原理和技术进行讨论的基础上,重点探讨了如何将Apriori改进算法应用于对Web日志的挖掘,提出了一种基于该算法的Web日志挖掘实现方法,实验结果表明了算法的有效性.  相似文献   

7.
在Web日志挖掘中应用聚类改进网站结构的研究   总被引:2,自引:0,他引:2  
介绍了Web日志挖掘的概念,通过聚类技术在Web日志中实现挖掘出访问网站的相似爱好的用户群体、页面之间的内在联系,以此改进网站性能和组织结构,提高用户查找信息的质量和效率.  相似文献   

8.
Web日志挖掘就是通过一定的方法分析Web日志数据,发现用户的访问习惯,帮助管理人员改进Web站点的性能和结构,提高用户获取知识的质量和速度.笔者首先在Web日志挖掘的背景下分析了模糊C均值聚类算法的缺陷,针对其的不足,在粗糙集理论的支持下,介绍属性信息量的概念,并通过计算待聚类对象的属性权值,区分重要性属性和噪音属性...  相似文献   

9.
随着数据挖掘和万维网技术的结合,使得从收集到的访问 Internet网页的网站日志记录中执行数据挖掘成为可能.将数据挖掘技术应用于 Web日志记录,来发现用户访问 Web页面的模式,便形成了 Web访问模式挖掘. Web访问模式挖掘是从 Web访问日志中挖掘有用的用户访问信息,用于找出头 N个用户,头 N个被访问页面,最频繁访问时间以及关联模式、序列模式、聚类模式、分类模式和 Web访问趋势等,这对于优化站点结构、为不同类别的用户提供个性化服务,有效地实现信息获取和信息推送是非常必要的. Web访问模式挖掘是目前数据挖掘领域的热点,详细论述了 Web访问模式挖掘的概念、方法和过程.  相似文献   

10.
传统Web挖掘技术面向所有Web用户,而访问网站时活跃用户与非活跃用户表现特征不同.基于此,提出一种面向活跃用户的访问模式挖掘方法,包括活跃用户会话提取算法(AUSM)和树型访问模式挖掘算法(WAPBUM).AUSM扫描一遍日志数据即可挖掘Web活跃用户并提取会话信息,在提取的用户会话信息基础上,利用网站拓扑结构给出了一种基于树结构的频繁访问模式挖掘算法(WAPBUM).WAPBUM针对Web日志挖掘特点,通过对子树构造等价类,自下而上产生频繁子树.人工数据集和真实数据集上的实验都证明AUSM算法的运行时间与Web日志数据量成线性关系,且运行过程中内存保持稳定;WAPBUM在处理带根子树挖掘时明显快于FREQT算法,所挖掘结果可有效应用于网站结构分析.  相似文献   

11.
在Web日志挖掘中,对传统的会话识别方法进行改进,提出了基于统计特征的会话识别方法,通过使用统计值来动态设定访问时间阈值以识别会话.  相似文献   

12.
万维网的出现使得计算机拥有了海量的资源,但也困扰着人们获取其中有用信息.W eb挖掘的应用为解决此问题指明了方向.对W eb挖掘的最新技术及发展方向进行了论述,包含W eb挖掘分类,W eb挖掘的特征和两个具体的W eb挖掘算法,最后提出一个具体的W eb挖掘系统SWMS模型.  相似文献   

13.
Web日志信息的预处理是Web日志挖掘任务中的重要阶段,是整个Web日志挖掘过程的基础,在Web日志挖掘中起着重要的作用,数据预处理关系到Web日志挖掘的质量.对数据预处理的基本知识及Web日志数据预处理的四个阶段进行了综述和研究,并给出了一些算法的伪码以及经过预处理的事务在实际事务数据库中的存储形式.  相似文献   

14.
基于电子商务的Web挖掘技术研究   总被引:6,自引:0,他引:6  
Web挖掘是数据挖掘与Web领域相结合的产物.本文首先讨论了Web数据挖掘的基本知识,然后在此基础上深入分析了Web挖掘技术在电子商务领域中的具体应用.  相似文献   

15.
提出了一种基于Web日志挖掘的网页推荐系统。该系统采用Web日志挖掘的方法对用户的访问记录进行分析,挖掘出与用户访问的页面具有一定相关度的页面并推荐给该用户,为用户提供最合适、更具人性化的信息资源。  相似文献   

16.
关联规则挖掘方法是Web挖掘的主要方法之一,本文在讨论了关联规则挖掘方法的一般知识后,重点研究了基于Web的兴趣关联规则挖掘技术.通过该技术可挖掘出访问者的兴趣爱好等信息,帮助网站经营者调整经营策略,提高网站的访问效率.  相似文献   

17.
介绍了Web挖掘的基本情况,分析了Web使用信息挖掘的步骤.提出了基于Web使用信息挖掘的个性化推荐算法,并将其运用到网络教学中,得出了个性化的网络教学体系结构.  相似文献   

18.
为了提高PageRank算法检索结果的精确度,分析了PageRank算法的基本原理和存在的不足,提出了基于超链接文本语义相关性的超链接算法.算法的特点是提取页面的超链接文本,计算检索关键词与超链接文本的语义相关度,并结合PageRank超链接分析算法来估算页面的重要性.实验结果表明,该算法可以提高PageRank算法的检索精确度.  相似文献   

19.
提出了一个基于隐马尔可夫模型的自适应站点模型。通过对用户访问序列进行语义分析,提取出访问路径中蕴含的信息需求,依此进行站点调整、页面推荐及预取,全面提升了站点的自适应性能。  相似文献   

20.
Web访问挖掘中事务聚类研究   总被引:4,自引:0,他引:4  
Web访问挖掘可以发现用户浏览Web的目标、兴趣等行为模式,使Web变得更容易获取信息。聚类分析是Web访问挖掘系统的重要组件,聚类分析的质量决定挖掘结果的有效性。现有的三类聚类算法具有各自的缺点,本文概述了三种算法,给出了一种基于广义后缀树的聚类算法,通过实例说明了它的原理和优点。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号