共查询到20条相似文献,搜索用时 131 毫秒
1.
2.
3.
随着Internet技术的高速发展,如何从海量的Web信息中快速而有效地获得所需信息也就成为一项重要课题,而数据挖掘技术是解决这一难题的有效办法。其中数据挖掘中的聚类方法是用来发现数据分布的一项重要方法。本文首先阐述了Web挖掘的有关理论,然后针对Web挖掘中的分层聚类法进行了较为详细的论述,最后使用该算法并结合改进的特征权值计算方法和文本相似度的计算方法,建立了训练文本库。 相似文献
4.
5.
协同过滤目前较为成功地应用于个性化推荐系统中.但随着系统规模的扩大和待推荐项目的不断增加,协同过滤面临着稀疏性问题和新项目推荐问题,制约了推荐效果.在此分析了传统协同过滤推荐方法中存在的问题,提出一种基于项目分层的个性化推荐方法.采用了基于多层兴趣表示的用户相似性算法,并结合相似用户推荐项与项目相似性来推荐新项目.该推荐方法在稀疏数据集上能表现出较好的推荐质量,同时也能够有效地解决新项目推荐问题. 相似文献
6.
7.
针对传统推荐算法精准度不高的问题,在潜在狄利克雷分布(LDA)主题挖掘模型的基础上提出了一种新的适用于图书推荐(BR)的数据挖掘模型——BR_LDA模型。通过对目标借阅者的历史借阅数据与其他图书数据进行内容相似度分析,得到与目标借阅者历史借阅图书内容相似度较高的其他图书。通过对目标借阅者的历史借阅数据及其他借阅者的历史借阅数据进行相似性分析,得到最近邻借阅者的历史借阅数据。通过求解图书被推荐的概率,最终得到目标借阅者潜在感兴趣的图书。特别地,当推荐数量为4000时,BR_LDA模型比基于多特征方法和关联规则方法精准度分别提高了6.2%、4.5%;当推荐数量为500时,BR_LDA模型比协同过滤的近邻方法和矩阵分解方法分别提高了2.1%、0.5%。实验表明本模型能够更准确地向目标借阅者推荐历史感兴趣类别的新图书及潜在感兴趣的新类别的图书。 相似文献
8.
9.
针对现有微博推荐中未考虑分层关系对兴趣影响的问题,提出一种基于分层社交关系的微博推荐算法.首先基于时间窗口计算相对亲密强度与社交增长率来构建分层网络;其次在网络中量化影响力、吸引力、交互紧密度来挖掘目标用户潜在兴趣;然后依据短文本扩展策略获取目标用户显性兴趣;最后将潜在兴趣与显性兴趣融合,计算融合兴趣与待推荐微博的相似度实现推荐.实验结果表明,与经典的微博推荐方法相比,该算法在准确率、召回率、F值、MRR上均优于其他方法,最高提高了14.73%.由实验结果可知,综合考虑潜在兴趣和显性兴趣可以提高微博推荐效果. 相似文献
10.
YANG Jie 《数字社区&智能家居》2008,(24)
对现有的Apriori算法进行改进,用分治策略引入哈希技术的方法完成了压缩侯选集,减少频繁扫描数据库的次数,克服了原有关联规则的数据挖掘算法生成频繁集比较大,且需要反复扫描数据库的问题。 相似文献
11.
基于页面聚类的推荐算法常被应用在个性化推荐系统中,但是很少考虑页面访问的顺序性.针对这种弊端,提出了一种新的路径相似度系数,同时在推荐算法中运用了关联规则,提高了推荐结果的准确性. 相似文献
12.
混合算法用于学习资源的自动推荐 总被引:2,自引:0,他引:2
提出一种基于决策树和BP网络的混合算法。采用决策树挖掘学生初始学习能力的行为模式以及应用BP神经网络算法评价用户的学习程度,以学习者对资源的掌握程度形成个性化的学习模式,并自动地对其将要学习的后继知识进行预测以及合理推荐。理论分析和实验结果都表明,该算法具有显著的推荐能力。 相似文献
13.
14.
会话识别是Web日志预处理过程中的一个重要环节,针对传统会话识别的不足,提出一种改进的会话识别算法.在识别出具体的用户之后,过滤大量的框架网页;然后根据每个页面的内容及网站结构,构造出相对合理的页面访问时间阈值,并以此阈值来进行用户的会话识别.最后通过实验数据,与几种传统的会话识别方法进行了比较,表明该算法更为合理有效. 相似文献
15.
路径补全是Web日志数据预处理的重要阶段,目前的路径补全技术大多基于静态网站结构实施。个性化推荐技术的广泛应用,使站点结构由静态结构转变为动态结构。针对目前各种路径补全算法无法解决动态站点结构下用户访问路径中页面缺失的问题,提出动态站点结构的概念、构造方法及站点结构的图结构存储策略。在此基础上,提出一种在动态站点结构下的基于页面类型的用户访问路径补全算法PCBPS(Path Complement Based on Page Sort)。实验证明在动态站点结构下,这种方法能较准确地恢复用户访问路径中的缺失页面,较好地提高了路径补全的准确率。 相似文献
16.
基于多示例学习技术的Web目录页面链接推荐 总被引:2,自引:0,他引:2
在Web目录页面中,向用户推荐其感兴趣的链接有助于用户高效地访问网络资源.然而,用户往往不愿花费很多时间来标记训练样本,其提供的数据可能只能说明某个目录网页是否包含其感兴趣的内容,而不能明确标示出其感兴趣的具体链接.由于训练数据中缺乏对链接的标记,但预测时却需要找出用户感兴趣的链接,这就使得Web目录页面链接推荐问题相当困难.CkNN-ROI算法被提出用于解决该问题.实验表明,CkNN-ROI算法在解决这一困难的链接推荐问题上比其他一些算法更为有效. 相似文献
17.
针对传统协同过滤推荐算法推荐精度较低等问题,提出一种基于贝叶斯后验概率预测和非合作博弈的个性化推荐算法。采用文件主题模型求取用户与其参加过的所有社交活动的主题分布,利用隐含主题概率分布表征用户兴趣度,根据信任传递机制求取用户的直接信任和间接信任,形成用户间的信任度;将用户的兴趣度和信任度等隐式特征赋予合理的先验分布,利用贝叶斯后验概率预测隐式特征后的显式反馈;依据显式反馈将推荐结果转化为非合作博弈中用户效益最大化的纳什均衡求解。仿真对比实验表明,与其他三种推荐算法相比该算法的查准率至少提高了3.13%,查全率至少提高了2.62%。 相似文献
18.
19.
传统的二部图随机游走算法主要采用基于共同项目的相似度计算,并且项目之间、用户之间的影响程度是对称的,这种对称信息不能体现用户兴趣,推荐精度不高。为了提高推荐准确性,提出一种基于用户兴趣度的二部图随机游走方法。采用共同项目和用户打分项目数量的共同性质体现用户兴趣度,分析信息的不对称性,并在二部图中随机游走。实验表明,基于用户兴趣度的二部图随机游走算法提高了预测准确率和命中率。 相似文献
20.
个性化Web推荐服务研究 总被引:13,自引:1,他引:12
本文主要论述了个性化Web推荐构成,提出了基于Web挖掘的个性化推荐服务研究中的用户聚类、Web页面聚类、n元预测模型及页面加权算法。利用这些算法得到的个性化信息可以准确把握用户兴趣模式并为用户提供“一对一”的具备自适应性的智能个性化服务。 相似文献