首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
通过相似度支持度优化基于K近邻的协同过滤算法   总被引:19,自引:0,他引:19  
个性化推荐系统能基于用户个人兴趣为用户提供定制信息.此类系统通常使用协同过滤技术实现,其中一种广泛使用的经典模型是基于用户评分相似度的k近邻模型.使用k近邻模型需要预先计算出用户或者项目的k个最近邻居,k值过大时会导致计算量过大而影响推荐产生的实时性,而k值过小则会导致推荐精度下降.为解决此问题,该文中提出了一种新的最近邻度量--相似度支持度.基于相似度支持度,该文提出了数种能够在保持推荐精度和密度的前提下维持合理规模的k近邻的策略.在真实大规模数据集上的实验结果表明,相比传统算法,该文提出的策略能够在保证推荐精度的前提下大幅降低计算复杂度.  相似文献   

2.
研究了一种新的协同过滤推荐方法。针对推荐算法中相似度存在的不足,提出了兼顾"形状-距离"的云模型综合相似度测算方法;考虑用户之间的兴趣匹配,提出了云模型熟悉相似度的概念;提出了基于云模型熟悉相似度的邻居用户选择方法,进而产生推荐。实验结果表明,本方法提高了推荐准确度。  相似文献   

3.
协同过滤算法是个性化推荐系统中应用最广泛的一种推荐技术。随着用户数量和项目数量的增加,数据的稀疏性成为影响推荐质量的重要因素。为此,将传统相似度指标修正余弦相似性、Pearson相似度,与结构相似度指标Jaccard系数、Salton系数、IUF系数进行组合,提出6种组合相似度。在Movie Lens上的实验表明,基于组合相似度的优化协同过滤算法在平均绝对偏差MAE、均方根误差RMSE、召回率、覆盖率和确率等性能上都有了较大提高,提高了推荐质量。  相似文献   

4.
传统的基于余弦相似度度量的云模型协同过滤推荐算法未考虑特征向量的长度和维度,忽略了三个重要数字特征云期望、熵和超熵的关系,如各数字特征具有不同的性质和权重,导致特征丢失、区分度过小的问题。针对这些问题,提出了一种采用标准化的多维欧几里德相似度计算方法,通过将三个数字特征映射为三维空间的点,计算经指数函数标准化的欧几里德相似度,生成更合理的用户k近邻集,最终产生推荐。实验结果表明,该相似度计算方法能够为云特征向量提供更显著的区分度,并在一定程度上提高了推荐质量。  相似文献   

5.
推荐算法通过历史数据发现用户的兴趣偏好,在数据资源中寻找用户的偏好信息,并对用户进行推荐。目前,推荐系统中的协同过滤算法在各领域应用广泛,由于数据稀疏性和冷启动,使得推荐质量有所下降,为提升推荐精度,有学者从相似度方向进行研究。总结了推荐系统中最广泛使用的协同过滤算法,以及推荐系统中常用的传统相似度算法;对比分析了基于Pearson相关系数的相似度、余弦相似度、修正的余弦相似度等的适用场景;从冷启动和数据稀疏等方面分析了相似度的研究现状,研究表明通过混合相似度计算用户相似性,提高了推荐质量。最后,总结了相关文献在改进后存在推荐效率低、复杂度增高的问题,在提高推荐精度和推荐效率方面对相似度改进进行了展望。  相似文献   

6.
提出了一种基于项目综合相似度的协同过滤算法。综合相似度是项目相似度和类别相似度进行加权, 加权方式是从热能学中协同计算燃烧传热量的高温辐射换热综合发射率ε公式比拟得出, 两者均是计算综合系数, 在计算综合系数中可以通用。实验结果表明, 在推荐不同的前N个项目的实验中, 用新方法得到的准确率高于传统方法; 在固定推荐数目改变最近邻的实验中, 用新方法得到的准确率高于传统方法, 因此可以得出结论:基于项目综合相似度的协同过滤算法可以提高计算准确性, 提高推荐质量。  相似文献   

7.
传统协同过滤算法在计算相似度的时候,未考虑数据稀疏性以及项目类型相似程度,从而影响推荐质量.为了提高推荐精度,提出一种基于可信相似度的协同过滤算法.首先计算项目类型的相似程度与共同评分用户数和所有评分用户数之间的比例,然后根据类型相似程度和共同评分项的比例进行有机结合,计算相似可信度,形成合理的项目可信相似度.实验结果表明,该算法能够有效的提高推荐质量.  相似文献   

8.
为了减少协同过滤算法存在的噪音数据以及数据稀疏性问题,提高算法准确性,本文提出一种基于信息熵和改进相似度的协同过滤算法,使用用户信息熵模型来判断噪音数据,排除噪音数据对实验结果的干扰;使用面向稀疏数据的改进相似度计算方法,使用全部评分数据而不是依靠共同的评分项来计算,对缓解稀疏数据对推荐结果的精确性影响有很大帮助。实验结果表明,该算法能在一定程度上排除噪音数据对结果的影响,缓解数据稀疏对推荐结果精确性的干扰,提高该推荐算法的精确性,且缓解了传统推荐系统算法中常见的一些问题,与传统的协同过滤算法相比,该算法的精确性更高。  相似文献   

9.
基于相似度传递的协同过滤算法   总被引:2,自引:1,他引:1       下载免费PDF全文
协同过滤算法是个性化推荐系统中应用较广的算法之一。随着用户数量及项目数量的增加,数据的稀疏问题成为影响个性化推荐质量的重要因素。为此,提出一种基于相似度传递的协同过滤算法。该算法能使大于阈值的用户相似度在有限路径长度上传递,增加可用于计算推荐值的用户最近邻居的数量,减少数据稀疏问题的影响,提高推荐质量。  相似文献   

10.
基于邻居(neighborhood-based)的协同过滤是一项很受欢迎的用于推荐系统的技术.它可以分为基于用户(user-based)和基于项目(item-based)协同过滤.它通过用户或项目之间的相似性预测用户对于未评分项目的偏好.然而,传统的相似度方法易受数据稀疏影响.为了解决这个问题,提出了基于心理测量学(psychometrics-based)的相似度方法.实验结果表明,提出的相似方法更适合基于邻居协同过滤,它们可以提高推荐准确性和覆盖度(coverage).  相似文献   

11.
针对传统的协同过滤推荐系统存在的数据稀疏性和忽略时间影响的问题,本文提出了基于云模型的时间修正协同过滤推荐算法,利用云模型建立用户对项目特征属性的偏好度,并建立指数时间函数对项目的评分相似度沿时间维加以修正。算法采用美国GroupLens项目组提供的数据集进行实验。结果表明,该算法使得项目的评分相似度度量更趋准确,系统推荐质量有较明显的提高。  相似文献   

12.
基于信任因子的协同过滤推荐算法   总被引:3,自引:1,他引:3       下载免费PDF全文
传统协同过滤算法最后的预测值是用户最近邻评价的加权平均值,过于强调相似度的作用。除相似度以外,信任也是影响推荐结果的因素之一。该文提出以用户的评价个数和为他人提供推荐的次数为要素的可计算的信任模型与算法以及基于信任因子的协同过滤算法。该算法改变传统推荐过程中,用户之间的相似度唯一决定预测结果的现状,提高了推荐的精度。并通过一系列实验证明了该设想和算法的优越性。  相似文献   

13.
在豆瓣网络数据上对传统的协同过滤推荐算法进行改进,分别考虑最近邻和有向相似度方向的作用,对图书、电影和音乐收藏列表进行个性化推荐。推荐的结果在准确度、多样性和新奇性三种被广泛使用在衡量推荐算法效果的指标上进行比较和分析。结果表明,相比传统协同过滤推荐算法,两种改进算法均能够保证多样性和新奇性,同时最近邻算法可有效降低算法复杂度,而有向相似度算法则具有更高的推荐准确度。  相似文献   

14.
基于领域最近邻的协同过滤推荐算法   总被引:16,自引:0,他引:16  
协同过滤是目前电子商务推荐系统中广泛应用的最成功的推荐技术,但面临严峻的用户评分数据稀疏性和推荐实时性挑战. 针对上述问题,提出了基于领域最近邻的协同过滤推荐算法,以用户评分项并集作为用户相似性计算基础,将并集中的非目标用户区分为无推荐能力和有推荐能力两种类型;对于前一类用户不再计算用户相似性以改善推荐实时性,对于后一类用户则提出“领域最近邻”方法对并集中的未评分项进行评分预测,从而降低数据稀疏性和提高最近邻寻找准确性. 实验结果表明,该算法能有效提高推荐质量.  相似文献   

15.
针对现有推荐系统所采用的行为相似度度量方法,受数据稀疏性的影响难以获取到用户真正的偏好最近邻,影响了推荐准确度的问题,提出了一种结合基准相似空间分布优化的用户偏好获取方法.首先通过余弦相似度、修正的余弦相似性、皮尔森相关系数等偏好行为相似程度度量方法,获取用户与用户间原始的偏好行为近似程度,根据近似程度的分布特征首先获取偏好中心点,并根据偏好行为近似程度距偏好中心点的行为距离获取平均相似幅度,进而生成基准相似空间,通过建立基于平均近邻与异常评分交互影响的修正模型,优化基准相似空间,并据此为用户生成推荐列表.在大规模真实数据集上的实验结果表明:所提出方法与现有方法WSCF与OTCF相比,平均绝对误差分别降低了12.8%与9.7%,覆盖率分别提升了5.79%与3.83%,多样性与WSCF基本一致,相比OTCF增加了近4.3%,即是所提出方法提升了推荐精度与推荐质量.  相似文献   

16.
基于属性相似性的Item-based协同过滤算法   总被引:1,自引:0,他引:1       下载免费PDF全文
通过分析传统Item-based协同过滤推荐中的稀疏性问题以及新项目的冷开始问题,提出了一个基于属性相似性的Item-based协同过滤算法。该算法利用项目属性的相似性来修正原始相似性计算,综合考虑项目属性和用户评价对推荐的影响,改进了传统相似性度量方法在评价数据稀疏和新项目推荐中测量结果不够准确的问题。  相似文献   

17.
逐维聚类的相似度索引算法   总被引:5,自引:0,他引:5  
随着多媒体信息技术的迅速发展,多维度索引技术在图像、视频等可视信息的存储、检索方面成为一个重要的研究领域,针对“维数危机”难题,提出逐维聚类相似度索引算法,该算法根据数据集的分布特性,对特征矢量的每一维进行聚类,算法在实现检索时可以逐步滤除与查询矢量不相似的数据集,缩小检索范围,进而提高了检索速度,实验结果表明,逐维聚类算法适用于基于相似度的高维数据矢量检索和查询,是一种简单、灵活的索引结构。  相似文献   

18.
协同过滤算法是目前推荐系统中应用最广泛的技术,相似度的计算是该算法中关键的一步,它直接影响到后续的目标用户邻居集的选取及评分预测,最终决定着推荐的准确度。在传统的基于用户的协同过滤中,相似度的计算未考虑用户评分差异和商品的热度对相似度计算的影响。论文引入平均评分修正因子和热门商品惩罚因子,对传统的相似度计算公式加以优化。实验表明,改进后的相似度算法在电影推荐时,平均绝对误差(MAE)值较其他相似度算法更低,有着更好的推荐效果。  相似文献   

19.
相似自连接是一个在很多应用领域中很重要的问题.对于海量数据集,MapReduce可以提供一个有效的分布式计算框架,相似自连接操作也同样可以应用在MapReduce框架下.但已有研究工作仍然存在不足,如对于聚集数据区域采用加细划分方法,目的是负载平衡,但不易实现.现有的算法不能有效地完成海量数据集的相似自连接操作.为此提出了2个新颖的基于MapReduce的相似自连接算法,其思想是采用坐标过滤技术,形成有效候选集,以及针对聚集区域采用六边形划分的内切圆算法.过虑技术是在等宽网格划分基础上,利用同一维坐标间的距离差与相似性约束阈值ε进行比较,可以明显地减少候选集的数量,也证明了六边形划分是所有正多边形全覆盖中最优的划分方法.实验结果表明:新方法比其他算法有更高的效率,提高效率80%以上,它能够有效地解决有聚集区域的海量数据集的相似自连接问题.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号