共查询到15条相似文献,搜索用时 531 毫秒
1.
从Web日志中挖掘用户浏览偏爱路径 总被引:55,自引:0,他引:55
Web日志中包含了大量的用户浏览信息,如何有效地从其中挖掘出用户浏览兴趣模式是一个重要的研究课题.作者在分析目前用户浏览模式挖掘算法存在的问题的基础上,利用提出的支持一偏爱度的概念,设计了网站访问矩阵,并基于这个矩阵提出了用户浏览偏爱路径挖掘算法:先利用Web日志建立以引用网页URL为行、浏览网页URL为列、路径访问频度为元素值的网站访问矩阵.该矩阵为稀疏矩阵,将该矩阵用三元组法来进行表示.然后,通过对该矩阵进行支持一偏爱度计算得到偏爱子路径.最后进行合并生成浏览偏爱路径.实验表明该算法能准确地反映用户浏览兴趣,而且系统可扩展性较好.这可以应用于电子商务网站的站点优化和个性化服务等. 相似文献
2.
一种挖掘用户浏览模式的新方法 总被引:3,自引:0,他引:3
提出了页面兴趣度的概念,并把它用一个三元组(页面的访问时间,页面的大小,页面访问次数)表示.这个概念准确地反映了用户对页面的访问情况.在此基础上建立了以引用网页URL为行、浏览网页URL为列,页面兴趣度为元素值的网站访问矩阵.通过对该矩阵计算得到用户浏览偏爱路径.实验表明该算法能准确地反映用户浏览兴趣. 相似文献
3.
4.
5.
6.
吴瑞 《模式识别与人工智能》2007,20(6)
提出加权支持度和加权偏爱度用来准确反映用户的访问兴趣.其中,专家给定网页的语言评估被刻画成相应的模糊语言变量,使用模糊模拟的方法把这些模糊语言变量转化成表示网页重要性的权重.为了避免用户重要浏览信息的丢失,建立包含所有用户浏览信息的频繁链表加存权树(FLAAT),并从中挖掘用户偏爱的浏览模式.此外网页上的浏览时间也是反映用户兴趣和偏爱的一个重要因素,它被表示成相应的模糊语言变量,因而所获得的带有模糊浏览时间的用户偏爱浏览路径更能反映用户的兴趣和偏爱. 相似文献
7.
8.
引入一种挖掘用户兴趣路径的算法,并对其进行有意义的改进。算法的主要思想是:首先利用Web日志建立以引用网页URL为行、浏览网页URL为列的两个网站访问矩阵,分别采用访问次数和平均到网页中字符数的访问时间为元素值。然后,通过对矩阵进行路径兴趣度计算得到兴趣子路径,最后进行合并生成用户兴趣路径集。 相似文献
9.
基于Web数据挖掘的用户浏览兴趣路径研究 总被引:1,自引:0,他引:1
使用Web日志与用户浏览行为相结合的方式对用户浏览兴趣模式进行挖掘。分别建立以访问次数、平均到网页中字符数的访问时间和拉动滑动条次数为元素值的矩阵,通过对矩阵进行路径兴趣度的计算得到兴趣子路径,进行合并生成用户兴趣路径集。实例分析表明该算法是可行和有效的,对于电子商务网站的优化和实施个性化服务具有意义。 相似文献
10.
吴瑞 《小型微型计算机系统》2007,28(6):1098-1102
提出了使用语言最小支持度和偏爱度的web日志挖掘方法.表示用户兴趣和偏爱程度的支持度和偏爱度被刻画成相应的模糊语言变量,通过与最小语言支持度和偏爱度(模糊语言变量)比较,判定该网页是否是一个用户偏爱网页,这种语言的输入输出更自然更易理解.此外,网页上的浏览时间也是反映用户兴趣和偏爱的一个重要因素,它也被表示成相应的模糊语言变量,既体现不同网页浏览时间的不同,也可以忽略它们之间的细微差别.所获得的带有模糊时间的用户偏爱浏览路径更能反映用户的兴趣和偏爱性. 相似文献
11.
针对当前挖掘用户访问模式算法仅将频繁访问路径作为用户浏览兴趣路径的问题,依据使用Web日志挖掘用户兴趣页面时,通过引入页面信息量参数,综合考虑页面访问次数、浏览时间和页面信息量大小来定义用户兴趣度,提出了基于兴趣度的用户访问模式挖掘算法。实验证明该算法是有效的,在用户浏览兴趣度量方面比当前的频繁访问路径挖掘算法更准确。 相似文献
12.
Web日志中用户频繁路径快速挖掘算法 总被引:10,自引:0,他引:10
Web访问志中含有大量用户浏览信息,从中有效挖掘出用户频繁路径是建立自适用化网站的必要前提。该文在Apriori算法和有向图存储结构的基础上,提出了会话矩阵和遍历矩阵的概念,设计了用户频繁路径快速挖掘算法:首先利用会话矩阵筛选出满足一定阈值条件的频繁一项集,这样避免产生大量中间项;然后在相似客户群体内,对页面快速聚类,得到相关联页面;最后根据遍历矩阵对相关联页面进行路径合并,得出频繁路径。实验表明此算法的准确性和快速性。 相似文献
13.
结合Web用户访问特点,针对Web用户访问路径聚类分析中普遍存在的对象类别不确定性现象进行了研究.结合模糊聚类和可能性聚类的特点,提出来一种新的用户访问路径的可能性模糊聚类算法.新方法通过定义相关的截集,自动地将对象分配到若干簇中,避免了人工干预,实现了交叉聚类的目的.新方法建立在leader聚类算法的框架上,只需要扫描数据集一遍使得算法效率大大提高.在标准数据集上的对比试验表明新算法不仅是有效的,而且效率较高. 相似文献
14.
从Web日志中挖掘用户浏览兴趣路径,对于网站重构和产品推荐等商业用途具有重要意义。传统的挖掘算法一般基于用户访问频度,并不能真正体现用户的兴趣点。访问时间是一个能反应用户浏览兴趣的重要因素,用预设的访问时间阈值剔除无效数据,得出有效访问时间。本文对蚁群算法加以改进,用浏览频度和权值因子作为兴趣函数,有效访问时间因子作为信息素函数,提出有效-兴趣度的概念。对算法进行具体模拟,结果表明,本文提出的挖掘算法比传统的算法更能体现用户的浏览兴趣。 相似文献
15.
本文针对Web日志中用户会话识别阈值问题,给出一种基于时间密度的频度分析方法。文中首先将基于时间间膈参数刻度的用户访问频度定义为一个随机向量,给出了随机向量的切尾算法;然后建立频度与IP用户的相关矩阵,矩阵的列为访问频度,矩阵的行为用户IP,矩阵中的每一个值为某一时间间膈的访问频度。通过列向量的聚类分析,对不同类别用户的访问行为进行探讨。最后,对会话识别的阈值进行参数估计,并通过抽样对阈值进行检测和参数修正。 相似文献