首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 78 毫秒
1.
一种基于关联分类方法的Web用户兴趣预测   总被引:1,自引:0,他引:1  
对用户分类是Web挖掘的一个重要的研究方向。文中提出一种基于关联规则的分类方法,并且将它应用于用户兴趣预测。首先对服务器日志文件预处理,形成一个访问事务集。然后对该事务集进行数据挖掘,找出所有的满足最小支持度的类别关联规则。最后用这些类别关联规则去预测用户的兴趣。实验证明此方法是有效的。  相似文献   

2.
对用户分类是Web挖掘的一个重要的研究方向.文中提出一种基于关联规则的分类方法,并且将它应用于用户兴趣预测.首先对服务器日志文件预处理,形成一个访问事务集.然后对该事务集进行数据挖掘,找出所有的满足最小支持度的类别关联规则.最后用这些类别关联规则去预测用户的兴趣.实验证明此方法是有效的.  相似文献   

3.
基于用户访问事务文法的序列关联规则发现   总被引:4,自引:0,他引:4  
王实  高文  李锦涛 《软件学报》2001,12(10):1503-1509
在Web挖掘中,应用关联规则发现方法可以发现Web页面之间用户访问的关联度.由于Web站点内含丰富的页面结构信息,也由于用户的访问总是要遵循一定的访问顺序,因此提出一种新的可以发现用户访问序列之间关联度的方法——序列关联规则发现方法.该方法首先得到用户访问事务;然后根据正则文法,定义了一种新的用户访问事务文法,用于从用户访问事务中得到用户序列访问事务;最后应用关联规则发现算法进而发现序列关联规则.为了进一步评价所发现的序列关联规则,引入了互信息的概念.发现的序列关联规则可以帮助Web站点的设计者更好地理解用户的访问,以用于调整Web站点的结构.  相似文献   

4.
王瑜  刘连臣  吴澄 《微计算机信息》2008,24(15):109-111
本文通过对Web日志的处理,应用关联规则方法对用户访问行为进行挖掘,来发现资源间的关联性.通过对Apriori方法的分析,运用对事务集和候选项目集有效约减的方法,提出了基于Apriori算法的改进的快速Web资源关联规则挖掘算法FApriori方法.通过对KDDcup2000数据的验证,证明算法的有效性和正确性.  相似文献   

5.
一种基于最大频繁项目集的挖掘事务间关联规则方法   总被引:1,自引:0,他引:1  
任永功  张琰渝 《计算机科学》2008,35(11):185-188
Web事务间关联规则挖掘是通过发现网页之间的关联关系来预测用户的兴趣。提出一种新的事务间关联规则挖掘方法,通过对MAFIA算法改进,得到最大频繁项目集的同时得到对应的共有用户集,通过对事务内到事务间最大频繁项目集的转换,分析不同用户之间的关系,分析用户对网站上不同网页的访问数据,直接发现不同用户之间的关联关系来预测用户的兴趣。该方法经试验证明能够更加全面的预测用户感兴趣的网页,更好地为用户提供个性化服务。  相似文献   

6.
在对Web应用挖掘的基本步骤作系统性研究的基础上,设计了一个基于Web日志文件的关联规则挖掘模块。该系统应能够对用户访问Web时服务器方留下的访问记录进行挖掘,从中得出用户的访问模式和访问兴趣。为了识别用户浏览模式,实现了利用关联规则挖掘算法Apriori对Web应用挖掘过程中预处理阶段所产生的用户会话文件进行挖掘的模块,该模块针对用户选定的若干页面产生满足最小支持度和最小置信度的页面之间的强关联规则,并以文本的形式显示挖掘的结果。  相似文献   

7.
随着Internet的迅速发展,Web站点的访问用户越来越多样化,不同种类用户的访问模式有所不同.提出一种基于会话分类的Web用户访问模式挖掘方法.这套方法把用户会话划分为人类用户会话、网络爬虫会话和资源下载类用户会话三大类,在此基础上分别对3类用户的访问模式进行挖掘.通过会话分类可以提高挖掘的效率与准确性.其中重点研究了人类用户的访问模式挖掘,提出一种基于用户访问路径树的事务识别方法,并对PrefixSpan算法进行了改进.这套方法在实验中取得了很好的挖掘效果.  相似文献   

8.
一个最优分类关联规则算法   总被引:1,自引:0,他引:1  
分类和关联规则发现是数据挖掘中的两个重要领域。使用关联规则算法挖掘分类规则被叫做分类关联规则算法,是一个有较好前景的方法。本文提出了一个最优分类关联规则算法——OCARA。该算法使用最优关联规则挖掘算法挖掘分类规则,并对最优规则集排序,从而获得一个分类精度较高的分类器。将OCARA与传统分类算法C4.5和一般分类关联规则算法CBA、RMR在8个UCI数据集上进行实验比较,结果显示OCARA具有更好的性能,证明OCARA是一个有效的分类关联规则挖掘算法。  相似文献   

9.
本文旨在研究基于Web环境下利用关联规则对Web日志挖掘的数据分析系统。把关联规则的概念引入到Web日志挖掘中,将用户的访问路径以关联规则的形式表现出来,其目的在于从用户访问超文本系统的行为中发现用户的访问模式。然后在Apriori挖掘算法思想的基础上,对其改造,给出了适合挖掘用户访问频繁路径的类Apriori算法。最后设计开发了一个Web日志数据分析系统。此系统主要包含三个功能模块:数据预处理模块、智能分析模块和基本分析模块  相似文献   

10.
基于Web挖掘的个性化算法及其在网络教学平台的应用   总被引:11,自引:1,他引:10  
高鹏  高岭  王峥  胡青山 《计算机应用》2005,25(5):1012-1015
在Web挖掘的基础上设计针对Web服务的Web访问事务模型WTM和个性化推荐算法。算法以WTM为基础,旨在根据用户的访问模式向用户推荐个性化的Web资源。其利用关联规则得到的频繁项集实时地匹配用户的当前访问序列,对不同的用户提供不同的推荐资源。在此过程中不需产生所有的关联规则,提高了推荐的效率。最后,将该模型和算法应用于网络教学实践得出了个性化的网络教学环境。  相似文献   

11.
支持个性化推荐的用户分类规则挖掘的研究   总被引:1,自引:0,他引:1  
提出了一种应用决策树分类技术进行用户分类的方法 ,通过对 Web会话文件的处理、赋予类标记及决策树分类过程 ,实现了根据访问模式对用户的分类 ,以便个性化推荐和指导能够针对不同类别的用户进行 ,从而提高 E- Ser-vices中个性化服务的质量 .还讨论了待分类数据集中条件属性的选择和决策属性的类标记问题 ,给出了应用分类规则进行推荐的过程  相似文献   

12.
随着WWW网上可利用信息呈现爆炸性的增长,人们发现快速有效地访问相关信息正变得越来越困难。正是在这种情况下,Web数据挖掘技术应运而生。文中首先给出了Web挖掘的定义,深入分析了Web挖掘的特点及分类方法,然后对Web挖掘中最新研究进展状况作了详细的阐述,并探讨了Web挖掘的未来发展方向。  相似文献   

13.
针对现有Web数据挖掘方法发现的知识和规则存在不精确或不完全的问题,将粗糙集引入到Web挖掘中,进行Web事务聚类.粗糙近似算法基于用户访问序列的顺序和内容建立用户事务相似度矩阵,运用基于相似度矩阵的粗糙上近似提取初始类,使用相对相似性的条件作为合并准则,基于约束相似性的上近似形成后续类.粗糙近似算法能够有效挖掘Web访问日志,聚类Web事务,发现用户访问Web页面的模式.  相似文献   

14.
运用现代信息处理技术建立一个从获取新闻源、进行信息处理、运用文本挖掘技术对信息进行分析的系统模型。该系统模型是为了最终实现能够自动化获取新闻信息,并且可以对网络中的新闻进行自动分类和聚类,为用户推荐热门信息,描述某个热门信息在时间轴上的演化进程;协助用户以及某些机构去认识和了解网络中的信息演变进程。热点新闻信息挖掘研究的主要目的在于:可以使用户终端更全面更快地知道和了解所关心的新闻信息及其整体的发展方向;网站的维护者可以依据分析结果来更好地设计网站内容以迎合用户的最新喜好,以便较大地提高网站的质量;新闻热点信息的挖掘模型也可以给互联网演变研究给予一些帮助,使网络监督者可以更好地对网络内容进行引导和控制。  相似文献   

15.
Integration of Image Matching and Classification for Multimedia Navigation   总被引:1,自引:0,他引:1  
With the recent explosive growth in the volume of images on the World-Wide Web, it has become increasingly difficult to search for images of interests. The classification of images helps users to access a large image collection efficiently. Classification reduces search space by filtering out unrelated images. Classification also allows for more user-friendly interfaces: users can better visualize easily result space by browsing the representative images of the candidates. In this paper, we present a technique for image classification based on color, shape and composition using the primary objects. We apply this classification technique in image matching for image retrieval on the Web. Our experimental results show that this approach can maintain 73% of recall by searching only 24% of the whole data set. We also show how we apply such technique to assist users in navigation.  相似文献   

16.
Web使用挖掘是数据挖掘技术在Web信息仓库中的应用.Web使用挖掘通过挖掘Web服务器日志获取的知识来预测用户浏览行为,是Web挖掘技术中的一个重要研究方向.通常发现的知识或一些意外规则很可能是不精确的、不完备的,这就需要用软计算技术如粗糙集来解决.提出一种基于粗糙近似的聚类方法,该方法能够实现从Web访问日志中聚类Web事务.通过这种方法可以有效地挖掘Web日志记录,从而发现用户存取Web页面的模式.  相似文献   

17.
通过对电子商务中服务器上的日志文件等Web数据进行客户访问信息的分析,重点研究了客户分析系统的数据采集、数据处理以及跟踪客户在Web上的浏览行为并进行模式分析,并构建了用户访问模式的挖掘模型及算法的分析与实现。  相似文献   

18.
为了适应Web新闻以指数趋势增长,传播迅速,且Web突发事件新闻在互联网上散布等特点,同时针对传统文本分类方法准确率和效率低,寻找特定主题的突发事件新闻信息难等问题,提出一种基于规则与统计相结合的Web突发事件新闻多层次自动分类方法。首先提取类别关键词形成规则库,然后利用分类规则将突发事件分成四大类,再用朴素贝叶斯分类方法将各大类突发事件新闻进行细分,从而形成了基于规则与统计的两层分类模型。实验结果表明,该分类方法的准确率和召回率都达到90%以上,分类效率也普遍高于传统的分类方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号