首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 203 毫秒
1.
基于动态网站的语义数据挖掘模型研究   总被引:1,自引:0,他引:1  
WEB使用挖掘正逐渐成为WEB个性化服务领域的研究重点,它通过对用户历史使用信息的分析,实现网站的个性化服务。然而,由于动态网页对象URL结构的特殊性,导致了WEB使用挖掘在动态网站应用上的局限性。论文在基于WEB使用挖掘分析的基础上,针对动态网站数据挖掘和个性化服务,提出了语义数据挖掘模型,并详细描述该模型的挖掘流程。  相似文献   

2.
首先分析了WEB信息检索的现状,主要针对WEB信息检索的局限性,引出WEB数据挖掘,并对WEB数据挖掘技术作了概要的介绍.然后,讨论了WEB数据挖掘与WEB信息检索之间的关系,最后阐述了如何将WEB数据挖掘的研究成果应用到WEB信息检索领域中,从而提高WEB信息检索的效率和质量.  相似文献   

3.
基于粗糙集理论的WEB日志中关联规则提取   总被引:2,自引:0,他引:2  
随着互联网的飞速发展,WEB日志挖掘,也就是从WEB日志中发现和分析出用户的有用信息已成为研究热点.基于关联规则的方法是WEB挖掘的重要方法.本文应用粗糙集理论提取WEB日志中的关联规则,并将关联规则集用于用户行为的预测上,实验证明,该方法的预测精度要好于现有的方法.  相似文献   

4.
Intemet的普及和应用带来了WEB上的信息爆炸,如何基于WEB挖掘技术设计有效的信息推荐算法和推荐系统成为当前的研究热点。开发了一种基于WEB使用的推荐系统WRS(Web Recommendation System),在该系统中,提出了一种利用图形分割技术聚类用户访问模式的算法,并采用最长公共子序列算法对用户目前的行为进行识别。理论分析和实验结果表明,改进后的模型在推荐质量上有了较大提高。  相似文献   

5.
通过对WEB服务器日志文件进行分析,可以发现相似的客户群体、相关WEB页面以及频繁访问路径.这里提出了一种新颖的WEB日志挖掘算法,该算法是以服务器日志文件中的不同会话为聚类对象,通过对不同会话实施空间距离聚类和层次结构比较聚类,最终得到了满意的聚类结果.最后,给出了一个应用实例,实例表明,该方法是有效可行的.  相似文献   

6.
WEB数据挖掘旨在从大量的WEB数据信息中发现有用的模式和隐藏的信息,从而为决策者提供决策支持,优化市场策略,有效地解决当今互联网信息膨胀的问题。WEB数据挖掘的一个重要应用就是电子商务。电子商务是一个基于网络平台的现代化的商业模式,目前电子商务发展势头强劲,WEB数据挖掘在电子商务中必定有广阔的应用前景。本文将WEB数据挖掘与电子商务相结合,介绍了在电子商务平台中进行WEB数据挖掘的方法,从而为电子商务从业人员提供借鉴,以便更好地分析数据间的隐藏关系和模式,掌握用户喜好,为电子商务平台的市场决策提供决策支持,减少风险。  相似文献   

7.
Web页面包含了丰富的、动态的超链信息,挖掘超链及其周围的文档可以帮助用户找到感兴趣的、权威的内容。主要论述了基于超链的Web结构挖掘的方法,并对Web结构挖掘的一般方法HITS算法进行改进。采用这种改进算法,可以从任意页面集中计算出具有最大Authority权值和Hub权值的页面。从而把一个可信度的、权威的网站推荐给用户。  相似文献   

8.
一个基于XML的WEB数据收集模型的研究   总被引:15,自引:0,他引:15  
目前研究的热门领域Web数据挖掘是从WWW资源上抽取信息(或知识)的过程,是对Web资源中蕴含的、未知的、有潜在应用价值模式的提取。其一般的过程可表示为:信息的发现、信息的选择和预处理、分析过程、产生结果犤1犦。WEB上的数据收集是对WEB数据挖掘的一种支持技术,是WEB数据挖掘的第一步。该文提出了一种基于XML技术的WEB数据收集模型,并实现了其中的一些主要功能。同时针对模型系统的不足做了一些有意义的改进探索。  相似文献   

9.
马涛  刘昱琨 《微机发展》2003,13(4):71-73
通过对WEB服务器日志文件进行分析,可以发现相似的客户群体,相关WEB页面以及频繁访问路径,这里提出了一种新颖的WEB日志挖掘算法,该算法是以服务器日志文件中的不同会话为聚类对象,通过对不同会话实施空间距离聚类和层次结构比较聚类,最终得到了满意的聚类结果,最后,给出了一个应用实例,实例表明,该方法是有效可行的。  相似文献   

10.
本文从实际应用角度探讨了WEB文本挖掘系统的设计实现问题,文章首先分析了WEB文本挖掘的实现流程,并在此基础上对应用较为广泛的WEB文本挖掘聚类算法进行了对比分析,并采用SOM聚类算法作为系统的实现算法,在本文最后一部分,文章对SOM聚类算法的具体实现进行了深入的阐述分析。  相似文献   

11.
WEB上存在着大量数据,为了有效地利用这些数据,必须把它们从WEB页面中获取出来存放到数据库中.本文首先介绍了WEB环境下数据获取的相关概念与技术,基于此,提出了一种基于XML的WEB数据获取系统结构,讨论了它的主要组成.最后,给出了系统的实现方法.  相似文献   

12.
多媒体矿井监控系统的WEB发布   总被引:1,自引:1,他引:0  
多媒体矿井安全生产监控系统是一种监测矿井安全环境参数和控制生产设备的网络系统。系统采用WEB发布,使矿井安全生产数据上网,为煤炭企业管理人员提供了新的管理手段。以Frontpage2000制作WEB页面为基础,辅助ASP编码检索Acess2000数据库,使用COOKIES完成不同页面间信息传递,采用ACP实现控件在系统图形模拟页面中准确定位,并给出了如何利用微软OWC组件在服务器上生成各种复杂曲线的方法。  相似文献   

13.
黄亮  赵泽茂  梁兴开 《计算机应用》2012,32(6):1662-1665
Div+CSS流行于Web页面的布局,在这种布局下,网页中很多数据记录以重复结构的形式聚集在一个层级。为了更好地从网页中挖掘数据,提出了一种新的Web数据挖掘算法,把树编辑距离转化为字符串编辑距离的计算,改进字符串编辑距离算法,利用字符串编辑距离评价树的相似度,进而找到网页中的重复模式,提取数据。通过针对不同重复模式特征的网页的实验说明,基于编辑距离的Web数据挖掘算法不仅能提取具有根节点及上面几层相同的网页的数据,对具有底层节点相同的网页也是有效的。  相似文献   

14.
科技飞速发展,人们对个性化的信息服务的需求也越来越高。WEB环境下,信息服务机构如何满足人们日益增长的个性化需求?W E B数据挖掘技术便是关键的一环。  相似文献   

15.
基于GEP的多层关联规则挖掘算法及其应用   总被引:1,自引:1,他引:0  
为了在Web使用挖掘中挖掘网站服务器日志数据库的热点Web页面访问集及发现其关联规则,提出了一种新的基于GEP(gene expression programming,基因表达式编程)的适用于挖掘多层关联规则的算法.将泛化技术应用于GEP作为它的适应性函数度量,引入GEP强大的自搜索功能,进化到较优的种群后,再利用传统的支持度一置信度的方法在子数据库的多个层及层间挖掘频繁项及关联规则.该算法改进了传统多层关联规则挖掘框架,实验结果表明了该算法在大数据库中的有效性和高效性.  相似文献   

16.
从网络形成演化过程的视角探讨了舆情的形成与传播特征。采用复杂网络方法对WEB2.0大众生产虚拟社区的拓扑结构特征进行分析,发现虚拟社区合作网络的出度服从幂律分布,入度服从双段幂律分布,表明虚拟社区贡献者的选择行为具有较强异质性。在静态分析基础上,进一步采用基于改进LP指标的链路预测方法对WEB2.0大众生产社区舆情传播的潜在路径链接进行排序与分析,分析结果表明,在二阶路径情况下,被关注者的关注对象往往比被关注者的被关注对象更重要,在三阶路径情况下也得出类似结论,间接关注及其方向对舆情传播具有较大影响。  相似文献   

17.
点击流数据是分析互联网用户心理倾向的关键,用户感兴趣的页组关联就隐藏于WEB日志之中。网站页面间的隐式关联可以通过分析点击流数据实现。给出了一种挖掘关联页面的方法。关联页面发现算法采用了一种类似于Apriori的模型。算法克服了前人关联页面算法的一些缺点,能够更好地适应复杂的互联网环境。  相似文献   

18.
Antagonistic communities refer to groups of people with opposite tastes, opinions, and factions within a community. Given a set of interactions among people in a community, we develop a novel pattern mining approach to mine a set of antagonistic communities. In particular, based on a set of user-specified thresholds, we extract a set of pairs of communities that behave in opposite ways with one another. We focus on extracting a compact lossless representation based on the concept of closed patterns to prevent exploding the number of mined antagonistic communities. We also present a variation of the algorithm using a divide and conquer strategy to handle large datasets when main memory is inadequate. The scalability of our approach is tested on synthetic datasets of various sizes mined using various parameters. Case studies on Amazon, Epinions, and Slashdot datasets further show the efficiency and the utility of our approach in extracting antagonistic communities from social interactions.  相似文献   

19.
基于相似度计算的本体映射优化方法   总被引:3,自引:1,他引:2       下载免费PDF全文
谷志锋  刘勇  郭跟成 《计算机工程》2008,34(19):56-57,6
在基于相似度计算的本体映射中,相似度计算量大的主要原因是待映射概念和待计算属性过多。该文采用过滤策略,利用候选映射策略和信息增益策略减少待映射概念和待计算属性数量。该过滤策略充分利用本体特点和数据挖掘思想,有效滤除没有计算意义的概念和属性,减少了相似度计算量。实验结果证明,滤除的概念和属性对映射效果的影响很小。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号