首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
基于用户浏览行为度量浏览兴趣的研究   总被引:1,自引:0,他引:1  
准确地度量用户浏览兴趣是Web使用模式挖掘的基础,本文针对Web使用模式挖掘,首先分析了已有的度量用户浏览兴趣方式的不足之处,提出了一种基于用户浏览行为度量用户浏览兴趣的方法。分析了现有Web使用模式挖掘的数据采集方式,提出了一种综合利用服务器日志文件和客户端数据获取用户浏览信息的方法,从用户浏览网站的数据中抽取感兴趣的模式,理解用户的浏览兴趣行为,以便进一步改善网站结构或为用户提供个性化的服务。  相似文献   

2.
一种基于Web日志用户浏览模式的数据挖掘   总被引:1,自引:0,他引:1  
Web日志中包含了大量的用户浏览信息,如何有效地从其中挖掘出用户浏览兴趣模式是一个重要的研究课题.本文研究了Web日志挖掘的机理,在分析挖掘频繁遍历路径的问题特征和对其进行形式化描述的基础上,进一步提出了一种在Web日志中挖掘频繁遍历路径算法,该算法能够正确、快速地从Web日志中抽取频繁遍历路径.  相似文献   

3.
一种改进的基于浏览行为的用户兴趣模型   总被引:1,自引:0,他引:1  
主要讨论并建立了一种改进的基于用户浏览行为的用户兴趣模型,模型中综合考虑了Web用户对页面的浏览行为、对页面关键词的感兴趣程度、用户的短期兴趣和长期兴趣。在.NET平台下实现了WIPISES演示系统,在系统中嵌入本文所提出的改进的用户兴趣模型。仿真实验结果表明:使用本文改进的用户兴趣模型进行信息检索,其搜索效果优于目前主流的搜索引擎,而且Web用户的偏好性越强,WIPISES系统的优势也就越显著。  相似文献   

4.
电子商务中Web的客户访问模式算法的分析与实现   总被引:4,自引:2,他引:2  
毕利 《微电子学与计算机》2005,22(10):143-146,151
文章通过对电子商务中服务器上的日志文件等Web数据进行客户访问信息的分析,重点研究了客户分析系统的数据采集、数据处理、数据存储以及跟踪客户在Web上的浏览行为并进行模式分析,并构建了用户访问模式的挖掘模型及算法的分析与实现.  相似文献   

5.
根据Web用户的浏览历史建立用户浏览预测模型是Web环境下实现个性化服务和开发各种浏览导航工具的关键。该文首先利用PLSA模型对Web用户进行用户聚类,然后建立基于用户类别的混合Markov链用户浏览预测模型,该模型更能准确地描述用户浏览特征。实验结果表明了该模型的优越性。  相似文献   

6.
单蓉 《信息技术》2011,(5):33-34,72
网络教育已成为现代教育技术主流的发展方向。提出了二层树状结构模型,并在此基础上,设计了一个基于基于浏览行为的个性化推荐系统(BB IRS)。系统可以通过离线和在线方式对用户的访问日志和交互数据分别进行挖掘,并通过根据用户的浏览速度计算用户对页面的兴趣度,根据该兴趣度是否大于阈值,系统采用不同的推荐策略。  相似文献   

7.
在网络技术高速发展的今天,Web技术得到普及,通过对Web的数据挖掘,用户能够获取到所需要的数据信息、知识,同时能够对用户的访问行为、内容进行深入分析.Web日志挖掘是数据挖掘中的重点内容,借助日志挖掘的数据预处理技术,获取到用户特征,将自身的Web的服务设计进行优化,开展针对性的网络活动.基于此,在本文中对Web日志挖掘中的数据预处理技术进行研究,提出预处理算法.  相似文献   

8.
数据的质量直的好坏接关系到数据挖掘的结果,因此数据预处理是Web日志数据挖掘首要的步骤,基于前期提出的几种数据预处理方法,提出了通用的Web日志挖掘的数据预处理模型,将Web日志数据的预处理分为5个步骤:数据清理、用户标识、会话标识、路径补充和格式化,并结合旅游网站进行了实例验证。证明该数据预处理模型是完全可行,并且具有良好的通用性和可扩展性。  相似文献   

9.
沈明  邓玉芬  张博 《现代电子技术》2010,33(9):180-183,186
频繁模式挖掘应用广泛,是数据挖掘中的一个重点研究领域,频繁模式挖掘应用的其中一个领域就是基于网页日志的数据挖掘。在网页日志中发现频繁模式的目的是获得用户的网络浏览行为模式,这些信息可以为广告设计以及创建动态用户日志提供参考。从网页数据挖掘的角度研究了三种频繁模式挖掘方式,这三种方式分别是:网页设置、网页序列以及网页图片挖掘。  相似文献   

10.
随着互联网的飞速发展,互联网和人们日常的生活、工作、学习等各方面的结合越来越紧密,为使互联网更好的服务于用户(通过Web个性化服务等方式),首先需要了解用户使用互联网的规律性特点,基于Web日志的Web用户行为模式挖掘能解决此问题.目前,Web用户行为模式挖掘仍然是一个新兴的研究领域,其中包含若干需要解决的问题.针对这些问题,在该领域已开展了大量的研究工作.从模式挖掘合理性、模式挖掘结构体系、模式挖掘过程三个方面对Web用户行为模式挖掘中关键问题的研究现状进行了介绍:Web日志中包含了用户访问互联网的一些规律性特征,这些特征可通过Web用户行为模式挖掘的方法得到;为改进模式挖掘、应用的效果,可以采用改进的挖掘结构比如结合内容、结构挖掘的整合结构;Web用户行为模式挖掘过程分为数据预处理、模式挖掘、模式应用三个阶段,这是一个正在发展的研究领域.  相似文献   

11.
为了使个性化推荐系统能适应用户浏览兴趣的变化,一个关键问题就是如何动态地更新用户的兴趣模型。提出了一种新的二层树状结构模型。模型的第1级节点表示用户的兴趣类型,及其对每一兴趣类的兴趣度高低:第2级节点是用户某一兴趣类的向量空间模型表示。并通过分析Web环境下用户的浏览速度,改进了兴趣类兴趣权值计算公式,然后通过用户在这张页面上的浏览速度和页面内容与兴趣类主题的相关程度来更新模型。试验表明改进的计算公式能将兴趣估计的一致性提高到70%。  相似文献   

12.
基于页面请求的DDOS攻击比传统的海量报文攻击更具杀伤性且检测困难。传统的检测方法包括:特征检测,利用隐马尔科夫模型分析Web页面访问行为。相比明文解析与数学估计,提出了分析用户浏览行为相似性界定HTTP-GetFlood攻击,将用户浏览页面切换与浏览时间的比值表示用户浏览行为,不同用户利用这个表达式计算的浏览行为值很难相等。DDOS攻击爆发时,肉机行为高度一致,导致浏览行为值重复率偏高,当高于一定阀值时判断遭受DDOS攻击。  相似文献   

13.
针对用户普遍使用的多页面浏览器产生树型结构的浏览路径,Web日志中将会呈现非时序的日志记录。本文提出了一种新的自上而下的用户访问路径收集算法,进而得出的用户在一次会话中可能访问的复数目的页面,由此得出全局目的页面访问频度矩阵,此矩阵的数据作为实现基于网络结构的推荐系统的核心数据。  相似文献   

14.
一种基于用户浏览行为更新的兴趣模型   总被引:3,自引:0,他引:3  
为了使个性化推荐系统能适应用户浏览兴趣的变化,一个关键问题就是如何动态地更新用户的兴趣模型.提出了一种新的二层树状结构模型.模型的第1级节点表示用户的兴趣类型,及其对每一兴趣类的兴趣度高低;第2级节点是用户某一兴趣类的向量空间模型表示.并通过分析Web环境下用户的浏览速度,改进了兴趣类兴趣权值计算公式,然后通过用户在这张页面上的浏览速度和页面内容与兴趣类主题的相关程度来更新模型.试验表明改进的计算公式能将兴趣估计的一致性提高到70%.  相似文献   

15.
用户兴趣度的计算是个性化服务的核心,而用户浏览网页时的行为能反映用户的兴趣。文中着重分析保存页面、收藏页面以及网页浏览速度这三种网页浏览行为,且在此基础上结合用户兴趣衰减因子,提出一种新的基于网页浏览行为的用户兴趣的计算方法,并利用K-means算法将浏览的网页内容聚类成不同主题,最后基于这三种网页浏览行为和用户兴趣衰减因子计算用户主题兴趣度。实验结果表明,提出的用户兴趣度计算方法是有效的。  相似文献   

16.
文章提出了一种Web日志分析中数据预处理阶段用户识别的新算法。这种算法基于用户浏览行为的建模,能够很好地处理同一用户在不同地点上网情况下的用户识别问题。本算法通过归一化的支持度指标来选择最能代表用户浏览行为的行为模式,并用布尔编码的方式提取特征。用户间的相似度采用余弦相似方法计算,并利用KNN(K=I)的分类方法来识别用户。在特定构造的数据集上的实验表明文章提出的算法能够不依赖于IP信息识别用户并具有较好的识别率。  相似文献   

17.
传统Markov链模型在用户浏览行为预测方面体现出较好的性能,但不能很好的体现出用户的兴趣度和所推荐的页面的重要性,因此本文提出类时齐Markov模型.该模型给不同的类别用户单独创建时齐Markov模型,并用时齐Markov模型的平稳分布表征用户的访问兴趣和页面的重要程度.本文进而提出了基于隐反馈的类时齐Markov推荐模型,在真实的WEB服务器日志数据上的实验证明,类时齐Markov模型具有更好的推荐性能.  相似文献   

18.
基于Web使用数据挖掘的个性化推荐系统设计   总被引:1,自引:0,他引:1  
Web使用挖掘是实现个性化推荐系统的有效途径。通过对网站日志数据进行挖掘发现频繁访问模式,再结合活动用户的访问页面序列来实现个性化的在线推荐。本文从体系架构及功能模块两个方面进行分析,提出了基于Web使用数据挖掘的个性化推荐系统架构。它包括三个方面:数据预处理、频繁访问路径挖掘及在线推荐。  相似文献   

19.
罗超 《信息技术》2004,28(11):4-7
利用Web日志文件,采用LossyCounting算法对用户频繁浏览路径进行挖掘。在设计中,根据频繁路径挖掘的实际情况对算法进行了优化和改进。实验表明该方法能快速准确地发现用户频繁浏览路径,且具有较好的可扩展性,适用于电子商务网站的站点优化和个性化服务等。  相似文献   

20.
为更直观掌握用户行为,基于运营商的海量用户业务日志为实验数据构建用户画像,分析研究用户基本属性、操作行为、偏好特征等维度。根据实际业务场景,结合改进的TF-IDF(词频-逆文档频率)标签权重算法开发不同维度用户画像标签体系,对用户操作日志中的潜在高风险信息进行数据挖掘,并输出可视化画像结果。实际应用表明通过用户画像能识别风险用户行为信息,同时也能为日志安全审计提供参考价值,帮助企业实现数据安全运营动态监测。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号