首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
提出了一种基于Web日志挖掘的网页推荐系统。该系统采用Web日志挖掘的方法对用户的访问记录进行分析,挖掘出与用户访问的页面具有一定相关度的页面并推荐给该用户,为用户提供最合适、更具人性化的信息资源。  相似文献   

2.
为提高用户的使用效率,提出基于连续查询模式挖掘(CQPM)算法的联机分析处理(OLAP)查询日志挖掘及推荐方法.CQPM算法在双向扩展频繁闭合序列模式挖掘算法(BIDE)的基础上加入查询之间的间隔约束,确保查询模式的连续性.提出方法通过基于查询后缀树的模糊查询模式匹配(AQPM)算法预测用户下一步有效查询,并将预测结果按概率大小排序后推荐给用户.通过8名OLAP分析人员在Mondrian OLAP服务器上的查询日志对提出方法进行性能评价,结果表明,相较基于prefixspan的改进算法,采用CQPM算法能够去除数量庞大的冗余的查询模式,相较基本的前缀匹配算法,AQPM算法能够提高推荐的准确率.  相似文献   

3.
首先介绍了Web日志挖掘和个性化推荐服务所包含的内容,然后具体讲述了网络教学系统体系结构的设计以及在该系统中所采用的关键技术和Clope算法与改进的Apriori算法。最后通过实验结果的分析说明构建基于Web日志挖掘的个性化网络教学系统可以完成因材施教的需求。  相似文献   

4.
随着互联网的飞速发展,如何高效利用万维网这一巨大信息源,从中挖掘潜在的有价值的信息和知识,已成为国际学术界一个研究热点.传统的Web信息检索技术已无法满足人们日益增长的Web信息检索和挖掘需求,而网络挖掘技术可以弥补搜索引擎的不足.重点介绍一个网络挖掘原型系统WebME,包括其系统结构、主要功能和特点,并提出了进一步完善的一些设想.WebME采用了一些独特的网络挖掘技术,集多种网络挖掘功能于一体,是目前国内功能最为全面的网络挖掘系统之一.  相似文献   

5.
利用少量具有类别信息的种子词,结合特征选择技术来提取每个类别的特征信息;再利用这些特征信息,结合文本分类等数据挖掘技术来提取特殊命名实体.过程中只有构造种子词的环节需要人工辅助,其他环节均实现自动处理.实验证明,该系统和方法能够从查询日志中挖掘出高质量的命名实体列表,6个类别上识别结果的平均P@500达到了77%.系统...  相似文献   

6.
Web日志挖掘技术的研究与应用   总被引:1,自引:0,他引:1  
Web日志挖掘是Web数据挖掘的重要分支,已成为研究人员关注的焦点。本文首先分析了Web日志的格式,再对Web日志挖掘过程中的数据预处理进行了深入的讨论,最后阐述了Web日志挖掘在网站建设上的应用。  相似文献   

7.
互联网上的大型站点每天都会产生大量的Web应用日志,这些日志中通常蕴藏着丰富且宝贵的信息,单节点的数据挖掘系统已无法满足挖掘海量Web日志的要求.针对该问题,研究利用云计算技术在存储和分析数据的优势,采用分布式数据挖掘方法,验证了以分布式模式挖掘日志较单机的集中模式的效率优势,提高了海量日志挖掘过程中存在的时空效率.  相似文献   

8.
介绍了XGMML和LOGML语言,在此基础上讨论了Web日志文件的预处理过程和一个基于XGMML—LOGML的Web日志挖掘体系结构,实例表明:与原始日志文件挖掘相比,基于XGMML—LOGML处理的Web日志文件挖掘所需要的时问更少,挖掘的内容质量更高,能更好地满足用户的需求.  相似文献   

9.
基于关联规则的Web日志挖掘算法   总被引:1,自引:0,他引:1  
分析了经典的基于关联规则的Apriori挖掘算法,对该算法在Web日志挖掘中存在的不足进行了讨论。针对这些不足,对该算法进行了改进,并介绍了算法的具体实现。经实验测试,改进后的算法具有更好的效率。  相似文献   

10.
随着数据挖掘和万维网技术的结合,使得从收集到的访问Internet网页的网站日志记录中执行数据挖掘成为可能。将数据挖掘技术应用于Web日志记录,来发现用户访问Web页面的模式,便形成了Web访问模式挖掘。Web访问模式挖掘是从Web访问日志中挖掘有用的用户访问信息,用于找出头N个用户,头N个被访问页面,最频繁访问时间以及关联模式、序列模式、聚类模式、分类模式和Web访问趋势等,这对于优化站点结构、为不同类别的用户提供个性化服务,有效地实现信息获取和信息推送是非常必要的。Web访问模式挖掘是目前数据挖掘领域的热点,详细论述了Web访问模式挖掘的概念、方法和过程。  相似文献   

11.
为了提高信息检索效率,在中文Web信息检索中引入了浅层文本分析技术。首先提取文本句子的谓词及与谓词直接关联的前置体词和后继体词。然后在将谓词转换成概念化表达的基础上,获取表达文本语义的语义向量。提出了一个语义向量相似度计算算法,用语义向量的相似度来度量文档之间的语义相似度。与主流网络搜索引擎比较,系统查准率方面有了较大提高。  相似文献   

12.
随着数据挖掘和万维网技术的结合,使得从收集到的访问 Internet网页的网站日志记录中执行数据挖掘成为可能.将数据挖掘技术应用于 Web日志记录,来发现用户访问 Web页面的模式,便形成了 Web访问模式挖掘. Web访问模式挖掘是从 Web访问日志中挖掘有用的用户访问信息,用于找出头 N个用户,头 N个被访问页面,最频繁访问时间以及关联模式、序列模式、聚类模式、分类模式和 Web访问趋势等,这对于优化站点结构、为不同类别的用户提供个性化服务,有效地实现信息获取和信息推送是非常必要的. Web访问模式挖掘是目前数据挖掘领域的热点,详细论述了 Web访问模式挖掘的概念、方法和过程.  相似文献   

13.
粗集理论在Web信息提取中的应用   总被引:1,自引:0,他引:1  
Web作为世界上最大的信息源,为数据挖掘技术提供了大量的原始数据,然而Web数据半结构化的特征使得在数据挖掘过程中必须选择合适的算法;研究Web信息提取的过程,并利用粗集方法实现对于来自Web的大批量农产品价格数据的挖掘过程。  相似文献   

14.
Web2.0强调知识、信息、思想的分享、互动和协作,为信息检索课教学带来了思想、方法和技术的变革,在教学中嵌入web2.0是信息检索课发展的一个难得的机遇。本文基于Web2.0的核心理念,探讨如何将Web2.0应用到备课、上课、课后辅导、评价这四个教学过程中,形成一种融教学、学习、交流和创新为一体的新教学模式,从而教学相长,使嵌入Web2.0的信息检索课教学取得良好的教学效果,并对目前基于Web2.0的信息检索课教学研究中存在的主要问题进行探讨与思考。  相似文献   

15.
基于SRI的动态网页信息抽取方法   总被引:1,自引:0,他引:1  
提出了基于相似记录项归纳的动态网页信息抽取方法.该方法采用编辑距离算法和树排列算法归纳产生记录项的包装器树.对各种类型网页进行信息抽取实验,取得98.11%的召回率和96.90%的准确率.  相似文献   

16.
基于电子商务的Web挖掘技术研究   总被引:6,自引:0,他引:6  
Web挖掘是数据挖掘与Web领域相结合的产物.本文首先讨论了Web数据挖掘的基本知识,然后在此基础上深入分析了Web挖掘技术在电子商务领域中的具体应用.  相似文献   

17.
结合中国人民银行萍乡市中心支行网络环境下的综合管理信息系统的开发,讨论了基于Web 的信息系统设计与实现的办法.  相似文献   

18.
利用搜索技术从Internet上搜索到大量的数据,如Web网站、网页等信息,对这些数据的处理是一个非常复杂的过程,通常可以使用数据挖掘的方法,提取其中有用的数据和知识.本课题对Web数据搜索与挖掘进行了研究,开发了一套从Internet上搜索数据,并对这些数据进行初步挖掘,生成有效数据的搜索系统.  相似文献   

19.
在研究传统信息检索技术实现的同时,结合现有的网页分类技术,提出了一种基于自动分类的智能信息检索系统原型系统.在此基础上,对基于分类的智能信息检索中的网页特征提取、特征加权、网页分类等提出了一些见解.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号