首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
基于项目的协同过滤推荐算法在电子商务中有着广泛的引用,该算法的核心是计算项目之间的相似度.传统的计算项目相似度算法仅仅通过项目间共同用户评分值差异来计算,在数据稀疏情况下,项目间共同用户评分值很少,导致此类算法性能严重下降.针对此问题,从项目间的整体评分角度出发,提出争议相似度的概念,争议相似度从项目间评分方差差异的角度衡量项目间相似性.将争议度特征融合到基于项目之间共同用户评分的传统相似度算法中,进而提出了融合项目争议度特征的协同过滤推荐算法,最终缓解了传统算法在稀疏数据情况下相似度计算不准确的问题.实验结果表明该算法在数据稀疏环境下可以明显提升推荐质量.  相似文献   

2.
传统的协同过滤算法中,依靠用户评分大小计算用户间相似度,但是评分数据稀疏性使相似度计算不够准确。针对此问题,提出了基于评分信息量的相似度计算方法;在推荐系统中项目有多种可选评分,该方法将参与评分的用户数量转换为评分信息量,以此结合用户评分大小计算相似度。实验结果表明,相对于传统协同过滤算法,该方法在一定程度上减少了评分数据稀疏性带来的负面影响,有效地提高了预测评分准确性。  相似文献   

3.
针对传统协同过滤算法中评分数据稀疏性及所造成推荐质量不高的问题,提出一种巴氏系数(Bhattacharyya Coefficient)改进相似度的协同过滤算法。在基于近邻协同过滤算法基础上,首先利用Jaccard相似性来计算用户间的全局相似性;其次使用巴氏系数获得评分分布的整体规律,并结合Pearson相关系数来计算其局部相似性;最后融合全局相似性和局部相似性得到最终的相似度矩阵。实验结果表明,该算法在稀疏数据集上获得更好的推荐结果,有效地缓解了评分数据稀疏性问题,提高了推荐的准确度。  相似文献   

4.
针对传统协同过滤推荐在数据稀疏性条件下性能不佳的问题,在相似度计算上做出了优化,提出了一种基于项目类别和用户兴趣相似度融合的协同过滤算法,算法将相似度的计算分解为两个方面进行:用户-项目类别评分相似度和用户-项目类别兴趣相似度,将两者用合适的权值加以融合得到最终相似度,参与最终预测评分的计算.利用MovieLens公用数据集对改进前后的算法进行对比.结果表明,基于项目类别和用户兴趣的协同过滤改进算法有效地缓解了数据稀疏性问题的影响,提高了推荐的准确性.  相似文献   

5.
为了减少协同过滤算法存在的噪音数据以及数据稀疏性问题,提高算法准确性,本文提出一种基于信息熵和改进相似度的协同过滤算法,使用用户信息熵模型来判断噪音数据,排除噪音数据对实验结果的干扰;使用面向稀疏数据的改进相似度计算方法,使用全部评分数据而不是依靠共同的评分项来计算,对缓解稀疏数据对推荐结果的精确性影响有很大帮助。实验结果表明,该算法能在一定程度上排除噪音数据对结果的影响,缓解数据稀疏对推荐结果精确性的干扰,提高该推荐算法的精确性,且缓解了传统推荐系统算法中常见的一些问题,与传统的协同过滤算法相比,该算法的精确性更高。  相似文献   

6.
基于用户的协同过滤推荐算法在进行近邻用户的筛选时以用户之间相似度的计算结果作为依据,数据量的增大加剧了数据的稀疏程度,导致了计算结果的准确性较差,影响了推荐准确度.针对该问题本文提出了一种基于用户联合相似度的推荐算法.用户联合相似度的计算分为用户对项目属性偏好的相似度和用户之间人口统计学信息的相似度两个部分.用户的项目属性偏好引入了LDA模型来计算,计算时评分数据仅作为筛选依据,因而避免了对数据的直接使用,减缓了稀疏数据对相似度计算结果的影响;用户之间人口统计学信息的相似度则在数值化人口统计学信息之后通过海明距离进行度量.实验结果表明,本文提出的算法在推荐准确度上优于传统协同过滤推荐算法.  相似文献   

7.
由于数据稀疏性问题的普遍存在,不仅传统的协同过滤系统中使用单一相似度进行的推荐不具备较高的可信度,而且共同评分项过于稀疏也会导致其推荐性能大打折扣。针对以上问题,提出了一种采用信任网络增强的协同过滤算法(记为ECFATN)。通过引入社会网络中常用的信任关系,即在原始的“用户-项目”评分矩阵上,通过信任计算建立用户间的信任关系,并使用传播规则传递信任关系,构建一个用户信任网络。最终使用用户间的信任度与相似度线性加权作为新的权重进行推荐。在真实的数据集上进行测试,实验结果表明,ECFATN算法不仅在一定程度上缓解了数据稀疏性问题并提高了推荐精度,而且由于信任关系的引入,对于用户冷启动问题也有较大的提升。  相似文献   

8.
协同过滤算法中存在着数据稀疏性和可扩展性问题,由于用户和项目数据量巨大致使数据十分稀疏,且不同数据集中数据存在差异,致使现有算法中的相似度计算不够准确和用户聚类效果不佳,对推荐算法准确率产生了显著影响。为了提高相似度计算和最近邻居搜索的准确率,提出了一种基于相似度优化和流形学习的协同过滤算法。通过加权因子优化相似度计算,结合流形学习对稀疏的用户评分数降维后进行谱聚类,通过获得的全局最优解提高聚类所得目标用户最近邻居的准确率,进而提高协同过滤推荐精度。在Epinions数据集和MovieLens数据集上进行实验,结果表明,提出的算法可以有效降低协同过滤算法的平均绝对误差和均方根误差,提高召回率,拥有更高的推荐准确率。  相似文献   

9.
任磊 《计算机应用研究》2020,37(10):2922-2925,2936
协同推荐是信息个性化服务中广泛应用的推荐算法,协同推荐算法以宿主系统所观测到的用户评分作为实现推荐的数据依据。用户评分矩阵的稀疏性问题对协同推荐的各工作过程可产生直接或间接的影响,导致推荐服务的准确性下降。通过对稀疏性问题影响推荐系统方式的分析发现,一般协同推荐方法的项目相似度计算只注重项目在评分数值上的相关性,而忽视了项目之间评分的重合度对提高推荐质量所起的重要作用。通过将评分重合度融入到相似度计算中,提出了一种结合评分重合度的改进协同推荐算法,并在稀疏评分环境下将其与已有协同推荐算法进行了对比实验与分析,实验结果验证了所提算法在提高预测准确性上的有效性。  相似文献   

10.
袁正午  陈然 《计算机应用》2018,38(3):633-638
针对传统协同过滤推荐算法在数据稀疏的情况下存在的性能缺陷和相似性度量方法的不足,为了提高推荐精度,改进原算法得到了一种基于多层次混合相似度的协同过滤推荐算法。该算法主要分为三个不同的层次:首先采用模糊集的概念将用户评分模糊化,计算用户的模糊偏好,并结合用户评分的修正余弦相似度和用户评分的Jarccad相似度总体作为用户评分相似度;再对用户评分进行分类来预测用户对项目类别的兴趣程度,从而计算出用户兴趣相似度;然后利用用户的特征属性来预测用户之间的特征相似度;其次根据用户评分数量来动态地融合用户兴趣相似度及用户特征相似度;最后融合三个层次的相似度作为用户混合相似度的结果。利用MovieLens公用数据集对改进前后的算法进行对比实验,结果表明:当在邻居集合数量较少时,改进的混合算法相对修正余弦相似度算法的平均绝对偏差(MAE)下降了5%左右;较改进的修正的Jaccard相似性系数的协同过滤(MKJCF)算法也存在略微的优势,随着邻居集合数的增加MAE也平均下降了1%左右。该算法采用多层次的推荐策略提高了用户的推荐精度,有效地缓解了数据稀疏性问题和单一度量方法的影响。  相似文献   

11.
相似性计算是协同过滤推荐的关键步骤,针对传统相似性计算认为相似关系是对等的且没有考虑消费顺序和时间间隔的问题,提出了基于时序逆影响的随机游走推荐算法。首先,基于用户时序关联图提出一种新的称为时序逆影响的相似性度量,利用随机游走得到了目标用户近邻集合;其次,利用随机游走在项目时序关联图上进一步改进推荐的多样性和覆盖率。它不但认为用户间相似是不对称的,考虑了用户消费项目的顺序和时间间隔,获得了用户全局的直接和间接近邻,而且考虑了项目间的时序逆影响。通过在真实数据集上的大量试验结果表明,与其他随机游走方法相比,不但能提高推荐性能、缓解数据稀疏,而且通过提高多样性和覆盖率解决了过拟合的问题。  相似文献   

12.
针对推荐系统领域中应用最广泛的协同过滤推荐算法仍伴随着数据稀疏性、冷启动和扩展性问题,基于用户冷启动和扩展性问题,提出了基于改进聚类的PCEDS(pearson correlation coefficient and euclidean distance similarity)协同过滤推荐算法。首先针对用户属性特征,采用优化的K-means聚类算法对其聚类,然后结合基于信任度的用户属性特征相似度模型和用户偏好相似度模型,形成一种新颖的PCEDS相似度模型,对聚类结果建立预测模型。实验结果表明:提出的PCEDS算法比传统的协同过滤推荐算法在均方根误差(RMSE)上降低5%左右,并且推荐准确率(precision)和召回率(recall)均有明显提高,缓解了冷启动问题,同时聚类技术可以节省系统内存计算空间,从而提高了推荐效率。  相似文献   

13.
传统协同过滤推荐算法存在数据稀疏性、冷启动、新用户等问题.随着社交网络和电子商务的迅猛发展,利用用户间的信任关系和用户兴趣提供个性化推荐成为研究的热点.本文提出一种结合用户信任和兴趣的概率矩阵分解(STUIPMF)推荐方法.该方法首先从用户评分角度挖掘用户间的隐性信任关系和潜在兴趣标签,然后利用概率矩阵分解模型对用户评分信息、用户信任关系、用户兴趣标签信息进行矩阵分解,进一步挖掘用户潜在特征,缓解数据稀疏性.在Epinions数据集上进行实验验证,结果表明,该方法能够在一定程度上提高推荐精度,缓解冷启动和新用户问题,同时具有较好的可扩展性.  相似文献   

14.
个性化推荐系统中使用最广泛的算法是协同过滤算法,针对该算法存在的数据稀疏和扩展性差问题,提出了一种基于用户兴趣和社交信任的聚类推荐算法。该算法首先基于聚类技术根据用户评分信息将具有相同兴趣的用户聚为一类,并建立基于用户兴趣相近的邻居集合。为了提高兴趣相似度计算的准确性,采用了修正余弦计算公式来消除评分标准的差异问题。然后,引入信任机制,通过定义直接信任、间接信任、传递路径和计算方法来度量社交网络用户之间隐含的信任值,将社交网络转换为信任网络,依据信任程度来创建基于社交信任的邻居集合。通过加权的方式将基于两种邻居集合的预测值融合起来为用户产生项目的推荐。在Douban数据集上进行仿真实验,确定了最优的协调因子值和分类数值,并与基于用户的协同过滤算法和基于信任的推荐算法进行对比,实验结果表明,所提算法的平均绝对误差(MAE)减少了6.7%,准确率(precision)、覆盖(recall)和F1值分别增加了25%、40%和37%,有效提高了推荐系统的推荐质量。  相似文献   

15.
邹洋  赵应丁 《计算机应用研究》2020,37(12):3578-3581,3598
针对传统推荐算法中存在的数据稀疏性问题,国内外许多研究人员都提出了相应的推荐算法。然而,在个性化推荐方面,其中大多数并没有取得很好的推荐效果。因此,提出改进填补法和多权重相似度相结合的推荐算法,该算法首先采用改进填补法填充缺失值并对数据降维,接着分别计算社交网络用户信任度和改进的二部图用户关联度,最后采用多权重因子将这两者相似度进行结合。基于此,该算法根据相似度高低获取邻居用户并对目标用户进行商品推荐。实验结果表明,在数据稀疏性以及个性化推荐情况下,该算法的平均绝对误差(MAE)优于其他推荐方法。  相似文献   

16.
协同过滤算法被广泛应用的同时一直存在着伸缩性和可扩展性困难的问题。针对该问题,提出了一种基于用户复杂网络特征分类的推荐系统协同过滤模型。首先,在用户集中基于度值选择特征用户,建立相似性阈值实现非特征用户分组;然后,构建用户—用户相似性网络,通过K-core分解完成网络中的社区标记;最后,目标用户在组内选择邻居,实现电影评分预测。基于MovieLens和Netflix数据集的实验结果表明,该算法与经典协同过滤算法相比,提升了时间和空间的性能,展现了更为出色的伸缩性和可扩展性。  相似文献   

17.
李红梅  郝文宁  陈刚 《计算机科学》2015,42(10):256-261
协同过滤是个性化推荐系统中应用较为成功与广泛的技术之一,影响协同过滤推荐质量的关键在于获取目标用户的k近邻用户,然后基于k近邻对其未评价的项目进行评分预测与推荐。针对用户评分数据的规模大、维度高、高度稀疏以及直接进行相似性度量的实时性差等对推荐性能的影响,提出一种基于LSH的协同过滤推荐算法,并对其进行改进。该算法基于p稳态分布的局部敏感哈希对用户评分数据进行降维与索引,并采用多探寻的机制对其进行改进,缓解多个哈希表对内存的压力,快速获取目标用户的近邻用户集合,然后采用加权方法来预测用户评分并产生推荐。标准数据集上的实验结果表明,该方法能有效克服评分数据的高维稀疏,并在保证一定推荐精度的前提下,大幅度提高推荐效率和降低内存消耗。  相似文献   

18.
In order to solve the scalability problem in news recommendation, a scalable news recommendation method is proposed. The method includes the multi-dimensional similarity calculation, the Jaccard–Kmeans fast clustering and the Top-N recommendation. The multi-dimensional similarity calculation method is used to compute the integrated similarity between users, which considers abundant content feature of news, behaviors of users, and the time of these behaviors occurring. Based on traditional K-means algorithm, the Jaccard–Kmeans fast clustering method is proposed. This clustering method first computes the above multi-dimensional similarity, then generates multiple cluster centers with user behavior feature and news content feature, and evaluates the clustering results according to cohesiveness. The Top-N recommendation method integrates a time factor into the final recommendation. Experiment results prove that the proposed method can enhance the scalability of news recommendation, significantly improve the recommendation accuracy in condition of data sparsity, and improve the timeliness of news recommendation.  相似文献   

19.
协同过滤算法作为一种信息筛选的重要方式,在大数据时代下受到越来越多的关注。但传统的协同过滤算法由于面临着严重的数据稀疏性以及只考虑用户间的评分相似性,导致推荐准确率较低。对此,提出了一种改进的协同过滤算法。利用[K]-means++算法对用户属性进行聚类,从而降低数据的稀疏性;考虑到用户兴趣会随时间发生动态变化,在传统的评分相似性中引入时间因素;将信任误差引入到用户间的信任关系中,从而改善用户信任度;将基于时间因素的评分相似性与改进的用户信任度进行融合,从而提高用户相似性的计算精度。在MovieLens数据集上进行仿真实验,结果表明,该算法能有效地提高推荐的预测准确性。  相似文献   

20.
王硕  孙光明  邹静昭  李伟生 《计算机科学》2017,44(9):250-255, 271
基于共同评分与项目全集的相似度未甄别近邻的推荐影响力,导致推荐质量低,可扩展性差。为此,提出了一种基于推荐影响度的并行协同过滤算法。该算法通过非共同评分项目、共同评分项类以及用户访问次数来计算用户推荐新颖度与兴趣重合度以度量用户推荐能力,并融入相似性计算来抑制相似度高但推荐力不强的用户,避免在项目全集上计算相似度,从而提高推荐质量;通过MapReduce并行化,使其具备良好的实时性和可扩展性。实验结果表明,该算法在海量数据集上的推荐质量更高,可扩展性更强。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号