首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 640 毫秒
1.
基于有向带权图的页面聚类算法研究   总被引:1,自引:0,他引:1  
聚类算法是数据挖掘中的一个重要的分析工具.Web使用挖掘中的聚类分析一般分为用户聚类和页面聚类.其中页面聚类是指导网站结构离线优化的重要方法.利用有向带权图表示用户的访问会话记录,对建立的有向带权图模型运用聚类算法实现页面聚类.选取真实数据对典型的聚类算法K-means算法、DBSCAN算法和COBWEB算法进行实验.实验结果表明,在选取的数据集范围内,COBWEB算法准确率要高于K-means算法和DBSCAN算法,时间性能与用户访问频率矩阵大小有密切关系.  相似文献   

2.
Web日志中含有大量的用户浏览信息,从中将相似用户及相关页面进行聚类是建立自适应网站的必要前提。通过基本的预处理,实现了日志的数据净化、用户识别会话识别及数据规约,形成了用户访问页面的序列数据库,同时通过离散化技术计算出用户访问页面频度。在这些数据准备工作的基础上,构造了用户一页面关联矩阵,作为改进的模糊C均值聚类算法的输入,实现了相似用户及相关页面的聚类。实验表明改进的FCM算法的有效性。  相似文献   

3.
模糊C均值聚类算法在Web使用挖掘上的应用研究   总被引:5,自引:3,他引:2  
Web日志中含有大量的用户浏览信息,从中将相似用户及相关页面进行聚类是建立自适应网站的必要前提.通过基本的预处理,实现了日志的数据净化、用户识别会话识别及数据规约,形成了用户访问页面的序列数据库,同时通过离散化技术计算出用户访问页面频度.在这些数据准备工作的基础上,构造了用户一页面关联矩阵,作为改进的模糊C均值聚类算法的输入,实现了相似用户及相关页面的聚类.实验表明改进的FCM算法的有效性.  相似文献   

4.
姜大庆  周勇 《计算机科学》2012,39(11):142-144
针对现有个性化推荐服务系统中用户会话聚类算法存在相似性度量准确性低和需要事先确定聚类数目的问 题,对序化的用户访问页面和对应的访问时间信息进行整合,提出一种基于动态规划算法的全序列比对方法来度量用 户会话的相似性。在此基础上,运用改进的NJ W谱聚类算法对用户会话进行自动谱聚类。实验结果表明,算法充分 考虑了用户会话的整体特征和局部信息,较相关比对算法具有更高的聚类性能,可以提高网站个性化推荐服务的效 率。  相似文献   

5.
权值矩阵聚类算法   总被引:1,自引:1,他引:0  
由于以往的算法不能对用户感兴趣的页面进行很好的聚类.所以将网站访问频度作为参数考虑进来,提出一个新的概念--权值关联矩阵,以Web服务器URL为行、以UserID为列建立URL-UserID关联矩阵,与普通的矩阵聚类算法相比,根据用户对某页面的兴趣度,再生成权值关联矩阵.从而发现相似的用户群体和相似的web页面.该算法通过上机实践,与传统的矩阵聚类算法相比具有识别准确率高,用户向量特征描述更准确,且能够更准确的反映网站的访问情况等优点.同时为用户提供个性化推荐服务铺平了道路.  相似文献   

6.
郭孝园  何臻 《工矿自动化》2012,38(8):100-104
为了解决煤矿企业网站用户查找信息难的问题,提出了一种基于Web日志的煤矿企业网站个性化推荐服务模型。该模型应用关联规则对新用户进行页面推荐,应用聚类算法对老用户进行页面推荐;并结合点击网页的次数、网页的浏览时间、雅可系数与最长公共路径系数来度量用户兴趣度的方法,可为用户准确地推荐其感兴趣的页面。测试结果表明,该模型能够有效地对网页资源进行分类并进行个性化推荐。  相似文献   

7.
针对以往个性化网站实时推荐系统存在很难预测用户未来浏览页面的不足,提出了一个混合型的实时推荐模型。该模型将动态模糊聚类技术和改进的关联规则相结合,既挖掘用户与页面的相似度权值形成知识库,又考虑用户的访问事务集增量构造访问模式树,通过修剪其相关分枝,快速生成候选推荐集,由推荐引擎附加在请求页面的底部,在不干扰用户的访问同时,又将用户感兴趣的内容推荐给用户。实验结果表明,该方法能有效地提高推荐的精确率和覆盖率以及综合评价指标。  相似文献   

8.
电子商务网站包含相当大的用户访问信息,对用户信息的数据挖掘,可以加强网站对用户访问信息的准确了解,提高电子商务网站的点击率。为此将提取电子商务网站日志中记录的用户访问链接数据,利用去噪技术对用户访问链接日志记录数据进行过滤分析,将过滤后的用户访问数据利用相异度二元关系组成二元数组,通过对二元数组的相异度分析计算,可实现电商务网站用户的聚类,为网站页面的优化及访问用户的兴趣、爱好的掌握提供参考。  相似文献   

9.
基于用户访问兴趣的路径聚类研究   总被引:1,自引:0,他引:1  
网站可以通过关注用户访问路径、访问某个页面的时间、在此页面的驻留时间以及由那个链接到此页面的URL等信息,利用聚类技术将具有相同兴趣的用户分类。文章将介绍一种新的基于用户访问兴趣的路径聚类算法,其中定义了新的兴趣度、相似度、及聚类中心。最后采用龙城热线网站日志进行真实测试,实验的结果是成功的。  相似文献   

10.
Web用户访问路径的差异性度量方法研究   总被引:1,自引:0,他引:1  
Web站点个性化已经成为当前研究的一个热点,人们通过各种方法,对网站内容、结构、用户行为等进行数据挖掘,建立用户兴趣模型,为网站用户提供更好的服务,加强网站的竞争力。在当前网站个性化的方法中,基于用户行为分析的方法是最具有竞争力的一类方法。对Web用户行为进行分析用得较多的技术是对Web用户访问路径进行聚类以发现有意义的模式。而良好聚类的前提是有效地度量Web用户访问路径的差异性。针对这个问题,提出了一种新的Web用户访问路径差异性度量方法,通过模拟实验也验证了方法的正确性。  相似文献   

11.
ABSTRACT

This study investigates how website design features, web page order and visual complexity, influence users’ initial website aesthetic impressions and how such impressions subsequently enhance engagement and intention to use the website. A laboratory experiment was conducted to test the hypotheses using different levels of web page order (high vs. low), visual complexity (high vs. low), and exposure time (one-second vs. no-time-constraint). Overall, the results from structural equation modeling (SEM) analysis suggest that web page order significantly influences visual appeal, engagement, and intention. In addition, the results of multigroup SEM analysis reveal that users evaluate website design very quickly (within 1 s), and that these evaluations remain remarkably consistent over time.  相似文献   

12.
何典  宋中山  梁英 《计算机应用与软件》2007,24(11):177-179,191
对通过URL-UserID关联矩阵得到页面聚类和用户聚类的算法进行了研究.指出了可以结合用户的交易结果来评价用户对商品页面的兴趣度,并给出了改进后的算法和计算过程,从而关联矩阵元素的权值能够更准确地反映用户对商品页面的感兴趣程度,使聚类分析结果更佳.  相似文献   

13.
在Web使用挖掘中,用户浏览模式的聚类结果有助于网站设计者理解Web用户的浏览特点和需要。设计了一种有效的Web浏览模式的聚类方法,网页是否被浏览及网页上的浏览时间反映了用户的浏览兴趣,它们被刻画成等长的用户浏览模式向量中的相应分量,此外,浏览模式之间的关系被刻画并被作为属性加入到该向量中,形成扩展的用户浏览模式向量,对这些向量使用粗糙k-均值法可对用户浏览模式进行有效的聚类。实例和实验分析说明,使用该方法的聚类结果更合理。聚类结果可用于个性化网站的设计。  相似文献   

14.
夏斌  徐彬 《电脑开发与应用》2007,20(5):16-17,20
针对目前搜索引擎返回候选信息过多从而使用户不能准确查找与主题有关结果的问题,提出了基于超链接信息的搜索引擎检索结果聚类方法,通过对网页的超链接锚文档和网页文档内容挖掘,最终将网页聚成不同的子类别。这种方法在依据网页内容进行聚类的同时,充分利用了Web结构和超链接信息,比传统的结构挖掘方法更能体现网站文档的内容特点,从而提高了聚类的准确性。  相似文献   

15.
介绍了目前应用较为广泛的两种算法——PageRank算法和HITS算法。PageRank算法是基于用户随机的向前浏览网页的直觉知识,HITS算法考虑的是Authoritive网页和Hub网页间的加强关系。PageRank算法的基本思想是:如果一个页面被许多其他页面引用,则这个页面很可能是重要页面;一个页面尽管没有被多次引用,但被一个重要页面引用,那么这个页面很可能也是重要页面;一个页面的重要性被均分并传递到它所引用的页面。而HITS算法则专注于改善泛指主题检索的结果,通过一定的计算(迭代计算)方法以得到针对某个检索提问的最具价值的网页,即排名最高的authority。  相似文献   

16.
Time-Aware Web Users' Clustering   总被引:1,自引:0,他引:1  
Web users' clustering is a crucial task for mining information related to users' needs and preferences. Up to now, popular clustering approaches build clusters based on usage patterns derived from users' page preferences. This paper emphasizes the need to discover similarities in users' accessing behavior with respect to the time locality of their navigational acts. In this context, we present two time-aware clustering approaches for tuning and binding the page and time visiting criteria. The two tracks of the proposed algorithms define clusters with users that show similar visiting behavior at the same time period, by varying the priority given to page or time visiting. The proposed algorithms are evaluated using both synthetic and real data sets and the experimentation has shown that the new clustering schemes result in enriched clusters compared to those created by the conventional non-time-aware user clustering approaches. These clusters contain users exhibiting similar access behavior in terms not only of their page preferences but also of their access time.  相似文献   

17.
用ASP实现WEB数据库智能查询   总被引:13,自引:0,他引:13  
在网站信息处理工作中,经常要从大量的数据中快速而又准确地检索出需要的一些信息,如学生成绩管理、商品订单管理,这些都离不开数据查询。由于不同的用户,查询的要求不同,因此对于不同的用户、不同计算机水平给出不同的查询方式。本文就如何利用ASP技术实现智能向导式查询作了一些探讨。  相似文献   

18.
There are many parameters that may affect the navigation behaviour of web users. Prediction of the potential next page that may be visited by the web user is important, since this information can be used for prefetching or personalization of the page for that user. One of the successful methods for the determination of the next web page is to construct behaviour models of the users by clustering. The success of clustering is highly correlated with the similarity measure that is used for calculating the similarity among navigation sequences. This work proposes a new approach for determining the next web page by extending the standard clustering with the content-based semantic similarity method. Semantics of web-pages are represented as sets of concepts, and thus, user session are modelled as sequence of sets. As a result, session similarity is defined as an alignment of two sequences of sets. The success of the proposed method has been shown through applying it on real life web log data.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号