首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 281 毫秒
1.
基于孟然论潜在语义分析的Web使用挖掘   总被引:2,自引:2,他引:0  
Web使用挖掘的首要任务是发现Web用户访问行为的模式.传统聚类算法对解空间的搜索带有盲目性和缺乏语义特征.提出了一种基于盖然论潜在语义分析(PLSA)的发现和分析Web访问模式的方法,即通过定量地衡量出Web用户和Web对象与潜在因素之间的概率关系,再利用盖然论的方法来完成各种分析任务.实验结果表明该方法具有高效性.  相似文献   

2.
用户兴趣空间的Web页面聚类   总被引:5,自引:1,他引:4  
文章基于日志挖掘,提出一种在用户兴趣空间中进行Web页面聚类的算法。算法的基础是用户访问频率矩阵A。A的行对应页面向量,列对应用户向量,A中元素是用户对页面的访问频率。对A中的行做聚类可以对页面进行相关聚类,对A中的列做聚类可以对兴趣相似的用户进行聚类。文章认为A中的这两种聚类是一对对偶问题。文章基于A和A中这两种聚类在权重之间的对偶关系,提出了用户兴趣空间的概念。用户兴趣空间突出了用户的共同兴趣,是一个正交空间。实验结果表明,与在A中直接做页面聚类相比较,用户兴趣空间中的页面聚类取得了较好的效果。  相似文献   

3.
文章提出了一种基于ISODATA的用户访问路径聚类算法,根据用户的访问兴趣定义了相似性测量手段和聚类中心。在对Web站点的访问日志进行事务识别后,根据群体用户对Web站点的访问顺序进行聚类,则每一个聚类集反映出该聚类集中的全体用户具有相似的访问兴趣。  相似文献   

4.
静态模型在推荐系统中往往将用户的兴趣偏好看作是固定不变的,而在一定程度上与实际并不符合.为此,基于隐Markov动态模型提出一种融合停留时间的类时齐隐Markov个性化推荐模型(ctqHMM).该模型用隐含状态变量的转移来模拟Web用户的兴趣变迁,并用停留时间来描述用户对某一偏好感兴趣的程度和所推荐页面的重要性.然后,提出一种基于该模型平稳分布的用户聚类方法,并将其用于推荐系统中.在真实的Web服务器访问记录数据上的实验证明,类时齐隐Markov模型具有更好的推荐性能.  相似文献   

5.
Web服务器日志中记录了用户的浏览模式,为了从中提取出具有相似访问模式的用户群,对其提供个性化服务,提出一种针对Web日志的分析方法。通过构建UserID-URL关联矩阵,引入加权关联矩阵,提出一种基于加权矩阵的聚类算法——多标记传播算法。实验表明,该算法在Web日志挖掘中进行用户聚类和页面聚类是高效可靠的。  相似文献   

6.
Web结构优化技术在降低访问延迟、提高访问效率上具有重要作用。由此提出根据用户访问路径建立Web层次模型(WHM),利用页面相似度合并同层相似页面,从而构建Web概念化模型(WCM)。实验及分析表明, WCM模型能够在适度聚类的情况下清晰地展现Web结构。此外,将WCM模型应用于预取系统,该模型所采用的聚类算法在预取效率方面明显优于传统方法,具有可行性和高效性。  相似文献   

7.
李健  马力  武波 《现代电子技术》2004,27(23):10-11,14
研究了一种基于Web文本聚类的用户兴趣发现方法.他通过Web文档信息获取,文本的形式表示,以及Web文本聚类方法最终提取用户兴趣知识,并给出了一个设计模型。  相似文献   

8.
结合关联规则与模糊C均值聚类(Fuzzy C-Means,FCM)进行用户聚类,首先将用户访问事务集构造出页面关联矩阵,以此来计算用户浏览路径之间的相似程度,接着利用FCM算法对用户进行聚类.通过与传统聚类比较的实验证明,此方法是有效的且更符合实际.  相似文献   

9.
基于网络用户行为的相关页面挖掘模型   总被引:11,自引:0,他引:11  
文章提出了一种基于网络用户行为的相关页面挖掘模型。模型采用统计的方法对proxy日志进行挖掘。模型的输入是一个WEB页面,输出是一组与之相关的页面。模型的假设基础是一组兴趣相似的人访问的页面有可能相关。模型从用户群中找出对输入页面感兴趣的用户,通过聚类从这些用户中找出一类具有相似兴趣背景且对输入页面最感兴趣的用户,综合这类用户感兴趣的页面,从中挖掘出与输入页面相关的页面。该模型与目前流行的相关页面检索算法的最大区别在于分析的对象是网络用户行为,因为模型认为页面是否相关的最终判定者应该是用户,通过分析网络用户行为能够更好地挖掘用户在页面相关判定上的潜在意识。用户对页面的兴趣度基于用户对页面的访问频率而定义。实验表明,该模型是可行的。该模型可用于改进传统的IR,提供相关反馈和查询扩展,使其更加适应Internet检索。该模型也可用于内容安全方面的相关主题预测。  相似文献   

10.
基于特征事务元素的用户事务聚类方法研究   总被引:4,自引:2,他引:2  
针对现有用户访问事务聚类算法复杂度较高的问题,文章提出了一种新的用户事务聚类算法。首先对用户事务中访问过的页面浏览次数和时间进行综合统计,并定义了函数,将其映射为页面访问时间属性值;其次通过抽取事务的特征事务元素集,建立新的聚类对象集事务,实现对原有事务的降维。最后给出计算事务相似度的方法.并得到一个模糊相似度矩阵以实现事务聚类。该算法具有较高的准确性,计算复杂度低,扩展性好,可以广泛地应用于电子商务领域。  相似文献   

11.
提出了用户兴趣感知的内容副本优化放置算法。该算法首先基于聚类算法从用户访问日志提取各用户的群体内容兴趣主题,依据其所辖用户的个体兴趣度加权得其群体兴趣度,并对其进行实时更新;然后在非线性优化模型下,以最小化平均响应时间为目标,优先放置群体兴趣度较大的副本,以实现被放置副本与用户内容兴趣主题的最大匹配。在平均响应时间、请求响应匹配度、负载均衡和邻近副本利用率等方面,与1-Greedy-Insert等算法进行对比,仿真结果显示各性能指标平均提升了约30%,验证了算法的有效性。  相似文献   

12.
随着互联网的飞速发展,互联网和人们日常的生活、工作、学习等各方面的结合越来越紧密,为使互联网更好的服务于用户(通过Web个性化服务等方式),首先需要了解用户使用互联网的规律性特点,基于Web日志的Web用户行为模式挖掘能解决此问题.目前,Web用户行为模式挖掘仍然是一个新兴的研究领域,其中包含若干需要解决的问题.针对这些问题,在该领域已开展了大量的研究工作.从模式挖掘合理性、模式挖掘结构体系、模式挖掘过程三个方面对Web用户行为模式挖掘中关键问题的研究现状进行了介绍:Web日志中包含了用户访问互联网的一些规律性特征,这些特征可通过Web用户行为模式挖掘的方法得到;为改进模式挖掘、应用的效果,可以采用改进的挖掘结构比如结合内容、结构挖掘的整合结构;Web用户行为模式挖掘过程分为数据预处理、模式挖掘、模式应用三个阶段,这是一个正在发展的研究领域.  相似文献   

13.
Data Replication for Improving Data Accessibility in Ad Hoc Networks   总被引:3,自引:0,他引:3  
In ad hoc networks, due to frequent network partition, data accessibility is lower than that in conventional fixed networks. In this paper, we solve this problem by replicating data items on mobile hosts. First, we propose three replica allocation methods assuming that each data item is not updated. In these three methods, we take into account the access frequency from mobile hosts to each data item and the status of the network connection. Then, we extend the proposed methods by considering aperiodic updates and integrating user profiles consisting of mobile users' schedules, access behavior, and read/write patterns. We also show the results of simulation experiments regarding the performance evaluation of our proposed methods  相似文献   

14.
提出一种基于最大频繁序列模式的页面推荐技术。由于考虑了用户会话的页面访问顺序,比一些不考虑页面访问顺序的推荐技术有更高的准确率。通过引入一树型结构.其上压缩存储了所有最大频繁序列。由于前缀相同的序列共享共同的树结点,从而大大节省了存储空间。推荐引擎截取用户活动会话中最近被访问的页面子序列,与树的部分路径进行匹配,无需在整个模式库中搜索相同或相似的模式.加快模式匹配的速度.更好地满足页面推荐的实时要求。实验证明,方法是有效的。  相似文献   

15.
庄艳  陈继明  徐丹  张凯隆  潘金贵 《电子学报》2009,37(8):1699-1706
 针对协作式虚拟环境多用户协作的特点和需求,本文提出了基于QoS的动态接入控制机制。该方法动态更新系统最小链路延时,用户在加入系统协作时,系统可将用户订购的服务质量与系统最小链路延时进行比对,从而允许用户加入或者被挂起。实验结果表明这种动态接入控制方法,能够稳定网络流量、减轻路由器处理负荷,同时能使用户实时获得系统状况,调节本地处理。  相似文献   

16.
王冲?  赵旭  邹毅  刘允才 《中国通信》2013,10(4):144-154
Crowded scene analysis is currently a hot and challenging topic in computer vision field. The ability to analyze motion patterns from videos is a difficult, but critical part of this problem. In this paper, we propose a novel approach for the analysis of motion patterns by clustering the tracklets using an unsuper-vised hierarchical clustering algorithm, where the similarity between tracklets is measured by the Longest Common Subsequences. The tracklets are obtained by tracking dense points under three effective rules, therefore enabling it to capture the motion patterns in crowded scenes. The analysis of motion patterns is implemented in a completely unsupervised way, and the tracklets are clustered automatically through hierarchical clustering algorithm based on a graphic model. To validate the performance of our approach, we conducted experimental evaluations on two datasets. The results reveal the precise distributions of mo-tion patterns in current crowded videos and demonstrate the effectiveness of our approach.  相似文献   

17.

The main objective is to create a secured classifier for datasets based on clustering algorithm. K-means algorithm is one of the efficient techniques for mining large databases based on cloud computing platform to store large database with least cost. Cloud computing allows users to outsource their data. For multi-dimensional data the clustering technique is implemented which performs clustering of related elements without advance knowledge. The K-nearest neighbor classification is analyzed by using dataset under different conditions of parameters. In view of the above, the development of data management with a cloud computing is gaining more attention towards multi-dimensional datasets. It is a challenging task to obtain secured data in evolution of data mining technique based on cloud computing employed using classifier techniques. Quality of education depends largely on teacher’s ability, performance, knowledge, assessment and prediction on the basis of data mining techniques and clustering. These approaches permit the educational institution to decide and evaluate the classification rule to determine and recruit the best teacher based on knowledge by using cloud database which is a challenging task. The proposed technique provides secured cloud computing details regarding teacher’s recruitment, privacy of user’s input query, selecting the best teacher and hides the access patterns on cloud. The proposed idea is computed by extracting the data and proves that it provides better accuracy for selecting the best teachers and also improves the speed and constancy of recruitment application. The teacher’s recruitment is used in evaluating the ranks based on performance so that, the institution takes a better decision for recruitment.

  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号