首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
针对传统单纯聚类算法实现网页推荐精确度欠缺的问题, 提出一种基于Web日志挖掘的个性化网页推荐模型, 并实现了相应的网页推荐算法, 算法结合聚类分析和关联规则挖掘, 能有效实现网页推荐. 实验结果表明, 在保障网页页面推荐覆盖率的条件下, 该方法有较高的精确度、 有效性和实用性.  相似文献   

2.
用户访问预测是根据用户的历史访问信息和当前的访问路径预测用户下一步或将来可能访问的页面.因此可以利用预测结果提高服务器的性能,提高缓存的利用率和为用户提供个性化服务.提出了基于Markov链和关联规则的预测模型MAPM(Markov chain and association rule prediction model),该模型首先使用二阶Markov链找到用户下一步或将来可能访问的页面集,生成预测候选集;然后再使用二项关联规则从正向和反向两个角度修正Markov的预测结果,从而生成最后的预测页面.  相似文献   

3.
基于Web使用挖掘的个性化站点研究   总被引:1,自引:0,他引:1  
针对用户特性向用户提供服务的个性化Web站点已经成为Web技术的研究热点.将数据挖掘技术应用于Web日志记录,来发现用户访问Web页面的模式,形成了Web使用挖掘.通过建立与更新用户模式库,个性化Web站点为用户的访问提供推荐.研究了Web使用挖掘技术,并对个性化Web站点的建立进行了探讨.  相似文献   

4.
使用Web数据挖掘技术对用户需求进行分析,其中实现Web信息个性化使用的是关联规则,这一规则能够为用户提供个性化服务,目前已成为Web应用技术的研究热点。该文分析了应用于个性化推荐的Web页面关联规则的特点,对Web数据挖掘技术常用的关联推荐算法进行探讨,内容主要涉及到Web数据挖掘技术、关联推荐算法的思路、算法分析。  相似文献   

5.
通过分析关联规则在Web个性化推荐中存在的问题,对Web个性化推荐的关联规则相关性分析算法进行改进,并进行了详细的论证和仿真实验。实验结果表明改进的算法能实现更低支持度的推荐,能提高推荐的准确率和速度。  相似文献   

6.
提出了推荐模型中的关联规则挖掘方法的改进,给出了自定义的页面权值的定义,并改进了基于关联图的关联规则挖掘算法,将页面权值应用于关联规则的挖掘中。此算法是利用Web日志中经过预处理后得到的数据进行规则挖掘,将处理后的数据应用正态分布函数来得到页面权值。用页面权值重新计算支持度,最后将得到的支持度应用于改进的规则挖掘算法中,形成一种基于权值的关联图的关联规则算法。  相似文献   

7.
Web用户访问模式挖掘   总被引:3,自引:0,他引:3  
随着网站内容的不断丰富和访问量的增加,网站结构变得越来越复杂,导致信息获取和推送都比较困难.将数据挖掘技术应用于用户访问模式,形成了Web访问模式挖掘.Web访问模式挖掘是从Web访问日志中挖掘有用的用户访问信息,据此可以形成关联规则、序列模式、聚类模式和分类模式等4类信息,这对于优化站点结构、为不同类别的用户提供个性化服务,有效地实现信息获取和信息推送是非常必要的.Web访问模式挖掘是目前数据挖掘领域的一个重要研究课题,结合研究工作,从概念、方法、任务、过程、应用及面临的挑战等方面对其进行了较详细的评述.  相似文献   

8.
邹丽霞 《河南科学》2010,28(9):1125-1129
对传统的关联规则挖掘算法FP-Growth方法进行改进,提出FP-Mine算法,并应用该算法对Web日志进行挖掘,探寻用户访问站点页面之间的关联规则,来帮助管理员改善站点的设计和企业改进市场商务决策.实验结果证明FP-Mine算法在生成频繁项集及关联规则的过程中,只需存储i-size和(i+1)-size频繁项集的节点的Freq-Set-Tree,且立即在其之上生成规则,所以缩短规则生成的时间,提高规则生成效率,同时释放i-size项集的节点,有效地节省内存空间.  相似文献   

9.
Web使用记录挖掘是采用数据挖掘技术对Web服务器上日志文件中的数据进行挖掘,以发现用户访问Web的方式及页面间存在的某种关联,从而可以为网站设计、提供网络个性化服务及其他电子商务活动提供决策依据.事务识别是Web使用记录挖掘前的一种数据预处理技术,本文介绍事务识别的基本方法,并给出一个最大前向引用序列事务识别新方法.  相似文献   

10.
基于MAS的Web用户数据预处理   总被引:1,自引:2,他引:1  
数据预处理是采用基于Web的使用挖掘发现用户模式的第一步.由于Web用户数据来源的不同,不仅导致用户的识别困难,用户访问页面的完整性也难于得到保证,这给下一步的用户模式发现带来了问题.本文提出了一个基于MAS的数据预处理方法:在客户端采用Agent精确捕获用户浏览行为,构造用户访问图;在服务器端的Agent保存服务器生成页面,并根据客户端Agent返回的数据完整获得用户的访问内容,为有效实现用户模式发现提供了保证.  相似文献   

11.
在几种流行的推荐算法的基础上,本文提出了一种新的融合用户聚类和关联规则的算法来改善推荐效果。该算法在经典的关联规则算法Apriori基础上引入多最小支持度的概念,并在关联规则算法之前进行用户聚类,在聚类算法中使用了包含字符属性的混合属性距离函数,提高聚类效果。在此算法的基础上,设计并实现了一种新的基于图书馆的推荐系统。实验证明该算法改善了数字图书馆中新书的推荐质量,去除了部分只含高浏览量图书的无意义规则,并趋向于发现相近种类图书的关联性。  相似文献   

12.
基于模糊集和粗糙集的关联规则挖掘策略   总被引:3,自引:0,他引:3  
提出了一种对原始数据先进行模糊聚类,再提取规则的基于模糊集和粗糙集技术的关联规则挖掘策略,可以在一定程度内减少噪声数据的干扰,消除数据对象中的冗余属性,有利于提高规则挖掘的有效性.  相似文献   

13.
基于数据挖掘技术设计并实现了个性化网络教学系统。该系统添加了数据挖掘模块,模块中采用Clope算法对HTML文档进行聚类分析,找出具有相似特性的学生群体,从而帮助教师进行有针对性的教学;同时,采用Apriori算法,根据学生的访问序列,挖掘出频繁项目集和关联规则模式,从而借助于网络向学生提供个性化教学服务。研究表明:使用数据挖掘技术能在一定程度上提高网络教学系统的个性化推荐服务水平。  相似文献   

14.
Web日志挖掘   总被引:19,自引:1,他引:19  
提出了一种新颖的MBP算法,它利用关联规则挖掘发现的频繁项目集以加快速度,能找出所有满足阀值约束的频繁浏览路径,该算法是有很效的,同时,针对Web浏览和日志文件固有的模糊性和不确定性,还讲座了Web面面的模糊聚类问题,最后,对发现的知识讨论了其在推荐系统及自适应Web站点中的应用并给出了相应算法。  相似文献   

15.
Web使用挖掘分析访问者日志,可以发现很多潜在的规律。利用会话之间的依赖关系,给出会话的依赖特征和数值度量,利用会话的动态特性给出会话动态聚类分析的算法和应用,并和模糊聚类算法方法进行比较研究。  相似文献   

16.
针对我国传统中餐点餐服务中欠缺针对性点餐推荐以及菜品推荐覆盖面较低的问题,提出一种关联规则结合基于菜品属性的推荐算法的混合推荐点餐模型。通过历史关联菜品组合和菜品的关键属性计算菜品关联度与相似度;然后,根据得到的菜品综合评分生成推荐规则来优化传统的关联规则FPgrowth算法推荐;最后根据顾客已点菜品启发式地进行后续点餐推荐。采集了真实的中餐馆历史点餐数据对模型和算法进行了有效性验证,实验结果表明该模型在达到一定菜品推荐数量时,在菜品推荐准确度和覆盖率方面优于传统的单一关联规则推荐,适合较多顾客中餐聚餐的点餐推荐。  相似文献   

17.
比较两种挖掘正态关联规则方法   总被引:1,自引:0,他引:1       下载免费PDF全文
首先采用两种聚类方法确定正态模糊数的两个参数,并借助正态模糊数模型来软化数量属性论域的划分边界,由此生成一系列的正态关联规则.接着给出正态关联规则的挖掘方法,此方法能挖掘出所有有意义的正态关联规则.最后对两种挖掘正态关联规则的方法进行了比较.  相似文献   

18.
指出了时序关联规则在支持度度量上的不足,存在处理高密度海量数据时往往要耗费大量的时间处理规模巨大的频繁候选集,同时需要多次重复扫描数据库,执行效率低等问题,提出了重新定义支持度度量方法的时序关联规则.针对时序关联规则在解决项分类时涉及到的分层不确定、不准确情形,引入了基于隶属度的模糊层次分类结构,定义了项间距离、项集间距离,最终得到一种新的关联规则间距离的度量方法.实现了模糊层次分类,将时序关联规则结果进行聚类分析,得到规则和规则之间相似性,实验验证了该方法的有效性.  相似文献   

19.
Web日志挖掘旨在使用数据挖掘技术从Web服务器日志文件中挖掘出有用的规律和模式,以此改进网站结构以及实现Web个性化服务。本文提出基于免疫聚类的Web日志挖掘算法,利用人工免疫系统的基本原理来进行用户聚类分析,从而发现相似客户群体、挖掘潜在客户。免疫聚类通过模拟免疫系统体液免疫应答的基本过程,提取出数据的基本特征,以此概括数据的分布特征,从而实现Web日志数据的无监督自组织聚类。通过在真实数据集上的实验证明了该算法的可行性和有效性。  相似文献   

20.
一种基于后缀树的中文网页层次聚类方法   总被引:1,自引:3,他引:1  
为了便于用户浏览搜索引擎产生的搜索结果,结合STC算法和变色龙算法提出了一种中文网页的层次聚类方法-STCC算法。该方法采用雅可比系数修改了STC算法中基本类相似度的计算方法,然后根据基本类相似度矩阵,利用变色龙算法完成网页聚类。实验结果表明:STCC算法与STC算法相比。聚类精度提高将近10%,避免了单链接算法的链式效应,适用于大规模网页聚类。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号