首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 161 毫秒
1.
李琳  朱阁  解庆  苏畅  杨征路 《软件学报》2019,30(11):3382-3396
根据用户的历史评分数据为用户提供推荐的商品列表,是目前推荐系统研究的主流.研究者发现,随着用户参与度的不断提高,将反映用户偏好的评论文本与评分数据结合,可以进一步提高推荐的质量.提出了基于潜在特征同步学习和偏好引导的商品推荐方法,将评论文本的主题与用户的"打分偏好"进行关联,同步学习用户评论文本的潜在主题、评分矩阵的用户潜在因子和商品潜在因子,并将潜在主题作为用户个人偏好引导来约束推荐方法对商品的预测打分.该方法对推荐质量的优化主要体现在两个方面:一是在评论文本的潜在主题和评分数据的两种潜在因子之间建立映射关系,同步求解主题模型和矩阵分解模型;二是将从评论文本中学习得到的潜在主题作为用户对商品的个性偏好引入到矩阵分解中,进一步优化推荐方法.在来自Amazon网站的28组真实数据集上进行实验,以均方误差为评价指标,与已有的模型进行了对比分析.实验结果表明,该方法有效减少了推荐误差,与已有的TopicMF方法相比,均方误差在数据子集上最大减少了3.32%,平均减少了0.92%.  相似文献   

2.
高娜  杨明 《计算机科学》2016,43(3):57-61, 79
协同过滤推荐算法由于其推荐的准确性和高效性已经成为推荐领域最流行的推荐算法之一。该算法通过分析用户的历史评分记录来构建用户兴趣模型,进而为用户产生一组推荐。然而,推荐系统中用户的评分记录是极为有限的,导致传统协同过滤算法面临严重的数据稀疏性问题。针对此问题,提出了一种改进的嵌入LDA主题模型的协同过滤推荐算法(ULR-CF算法)。该算法利用LDA主题建模方法在用户项目标签集上挖掘潜在的主题信息,进而结合文档-主题概率分布矩阵和评分矩阵来共同度量用户和项目相似度。实验结果表明,提出的ULR-CF算法可以有效缓解数据稀疏性问题,并能显著提高推荐系统的准确性。  相似文献   

3.
信息过载问题使得推荐系统迅速发展并广泛应用,同时也出现不法商家将虚假消费记录定量地输入到系统数据库从而改变推荐系统的推荐结果以获利.因此,本文围绕3个问题展开,即:为了提高推荐系统对虚假评论的鉴别能力,首先需要准确标注虚假评论的类标,如何能获取大量准确标定的虚假评论信息;如何有效过滤虚假评论从而提高推荐的可靠性;如何实现一种高效可靠的推荐系统.针对虚假评论信息难以准确标定,本文提出了一种基于文本生成式对抗网络的自动点评技术,依据历史评论文本自动生成虚假评论文本,并依据情感分析确定生成文本的对应评分;为了提高推荐系统对包含虚假信息数据的推荐效果,本文提出了一种基于图过滤的快速密度聚类双层网络推荐算法.该算法首先提出了一种能快速确定节点执行度阈值的基于图的过滤器,有效过滤数据内虚假信息,并设计了一种快速密度聚类双层网络推荐算法,提高推荐效果.将所提出的推荐算法应用到Yelp数据集上展开试验,验证本文提出的推荐方法的有效性.  相似文献   

4.
学术大数据的高速膨胀为学术工作者高效选择有效学术信息带来了巨大挑战,运用学术刊物推荐以应对学术信息过载是主流方式之一。此研究专门解决如何为论文手稿高效推荐合适投稿期刊这一问题。引入学术异构信息网络,融合论文文本主题信息,提出一种新的学术刊物推荐方法(SCVR)。借助主题模型建模论文摘要和标题等文本内容提取主题信息,指导不同类型节点映射到多主题特征空间;将元路径上下文信息聚合到目标节点,形成了多跳元路径下节点的多主题表示;将不同元路径下形成的节点向量进行融合,实现每个节点多元元路径下的多主题表示。SCVR利用节点文本内容和网络结构学习节点多主题表示,完成学术刊物推荐。在两个真实学术数据集上的测试发现,提出了一种基于异构信息网络且融合文本主题信息的学术刊物推荐方法,在相同条件下,SCVR的推荐效果比仅基于异构信息网络的推荐结果在Precision和NDCG上平均提高了2.7%,且比经典学术刊物推荐方法平均高了19%,说明SCVR在学术刊物推荐领域有更优良的性能。  相似文献   

5.
传统的协同过滤算法没有充分考虑用户和商品的交互信息,且面临数据稀疏、冷启动等问题,造成了推荐系统的结果不准确.在本文中提出了一种新的推荐算法,即基于融合元路径的图神经网络协同过滤算法.该算法首先由二部图嵌入用户和商品的历史互动,并通过多层神经网络传播获取用户和商品的高阶特征;然后基于元路径的随机游走来获取异质信息网络中的潜在语义信息;最后将用户和商品的高阶特征和潜在特征融合并做评分预测.实验结果表明,基于融合元路径的图神经网络协同过滤算法比传统的推荐算法有明显提升.  相似文献   

6.
微博文本短小、特征稀疏、与用户查询之间存在语义鸿沟的特点会降低语义检索效率。针对该问题,结合文本特征和知识库语义,构建基于潜在语义与图结构的语义检索模型。通过Tversky算法计算基于Hashtag的特征相关度;利用隐含狄利克雷分布算法对Wikipedia语料库训练主题模型,基于JSD距离计算映射到该模型的文本主题相关度;抽取DBpedia中实体及其网络关系连接图,使用SimRank算法计算图中实体间的相关度。综合以上3个结果得到最终相关度。通过短文本和长文本检索对Twitter子集进行实验,结果表明,与基于开放关联数据和图论的方法相比,该模型在评估指标MAP,P@30,R-Prec上分别提高了2.98%,6.40%,5.16%,具有较好的检索性能。  相似文献   

7.
协同过滤推荐算法通常基于物品或用户的相似度来实现个性化推荐,但是数据的稀疏性往往导致推荐精度不理想。大多数传统推荐算法仅考虑用户对物品的总体评分,而忽略了评论文本中用户对物品各个属性面的偏好。该文提出一种基于情感分析的推荐算法SACF(reviews sentiment analysis for collaborative filtering),该算法在经典的协同过滤推荐算法的基础上,考虑评论文本对相似度计算的影响。SACF算法利用LDA主题模型挖掘物品潜在的K个属性面,通过用户在各个属性面上的情感偏好计算用户相似度,从而构建推荐模型。基于京东网上评论数据集的实验结果表明,SACF算法不但可以有效地改善传统协同过滤推荐算法中数据稀疏性的问题,而且提高了推荐系统的精度。  相似文献   

8.
垂直学习社区包含了海量的学习资源,出现了信息过载现象,个性化推荐是解决这个难题的方法之一.但垂直学习社区中评分数据稀疏而文本、社交信息丰富,传统的协同过滤推荐算法不完全适用.基于用户产生的文本和行为信息,利用作者主题模型构建新的用户学习兴趣相似度衡量模型;根据用户交互行为信息综合考虑信任与不信任因素构建用户全面信任关系计算全面信任度;通过分析用户多维度学习行为模式,自动识别用户学习风格;最后提出融合兴趣相似度、全面信任度及学习风格的社会化推荐算法.用垂直学习社区网站CSDN实际数据集进行了实验分析.结果表明本文提出的推荐方法能更好向用户推荐其感兴趣的学习资源,有效地提高了推荐精度,进而提高用户学习效果.  相似文献   

9.
王建  黄佳进 《计算机科学》2017,44(2):267-269, 305
推荐系统是解决互联网信息过载问题的有效途径之一,其中具有代表性的是协同过滤推荐。传统的协同过滤推荐方法只考虑评分信息,而评论信息则包含了用户和物品更具体的特征信息。使用主题模型LDA并结合评分信息和评论信息,提出了一种基于用户改进的LDA算法。假设每个用户下隐含着主题分布,主题下隐含着物品分布,同时 词语的分布由主题和物品共同决定,该算法根据潜在主题分布挖掘用户兴趣进而完成推荐。实验结果表明,改进的算法有效提升了推荐质量。  相似文献   

10.
为缓解协同过滤推荐算法中评分数据稀疏问题对推荐结果的影响,提出一种融合文本评论和用户评分交互的推荐算法。通过将用户和商品评论各自潜在主题向量与用户、商品的潜在因子向量进行融合并各自进行评分,经过动态线性加权融合做出整体评分预测。在公开的多组数据集上,以推荐结果的均方根误差(RMSE)和平均绝对误差(MAE)为评估指标进行实验验证。实验结果表明,提出算法可以更好地刻画用户偏好和商品特征,有效缓解了评论数据稀疏性影响,提高推荐结果的准确性。  相似文献   

11.
With the rapid development of location-based social networks (LBSNs), increasing media data is ceaselessly uploaded by users. The multimedia data is often scattered and not informative and consequently they can not directly represent the semantics of each venue. Most of prior works leverage the user’ travelling histories to recommend new venues to users. However, these works often focus on the users’ travelling histories, while ignore the concepts or the popular levels of venues. In this paper, we proposed a quality model for venue recommendation by utilizing multimedia data to predict the interested level of each venue. First, we apply the graph cut method to generate the latent textual topics. Second, we leverage visual data from Flickr to train concept detectors to automatically label visual information. Third, the weighted bipartite matching algorithm is implemented to generate the venue multimedia topics by bridging the textual information and the visual information. Finally, we utilize the matching cost to predict the popular level of venue for recommendation. The experiments have been conducted on the cross-platform datasets. The results demonstrate the superiority of the proposed model.  相似文献   

12.
随着网络的发展,主题提取的应用越来越广泛,尤其是学术文献的主题提取。尽管学术文献摘要是短文本,但其具有高维性的特点导致文本主题模型难以处理,其时效性的特点致使主题挖掘时容易忽略时间因素,造成主题分布不均、不明确。针对此类问题,提出一种基于TTF-LDA(time+tf-idf+latent Dirichlet allocation)的学术文献摘要主题聚类模型。通过引入TF-IDF特征提取的方法,对摘要进行特征词的提取,能有效降低LDA模型的输入文本维度,融合学术文献的发表时间因素,建立时间窗口,限定学术文献主题分析的时间,并通过文献的发表时间增加特征词的时间权重,使用特征词的时间权重之和协同主题引导特征词词库作为LDA的影响因子。通过在爬虫爬取的数据集上进行实验,与标准的LDA和MVC-LDA相比,在选取相同的主题数的情况下,模型的混乱程度更低,主题与主题之间的区分度更高,更符合学术文献本身的特点。  相似文献   

13.
基于多主题追踪的网络新闻推荐   总被引:2,自引:0,他引:2  
陈宏  陈伟 《计算机应用》2011,31(9):2426-2428
针对网络新闻推荐系统推荐准确率偏低的问题,提出一种基于多主题追踪的网络新闻推荐算法。基于多主题追踪的推荐算法采用多个用户模型表示用户对不同主题的兴趣,并动态更新用户模型以动态反映用户的兴趣变化。实现了网络新闻推荐系统的核心推荐算法,并在标准路透社新闻数据集(RCV1)上验证了算法的有效性,有效提升了新闻推荐的准确率。  相似文献   

14.
Group topic modeling for academic knowledge discovery   总被引:2,自引:2,他引:0  
Conference mining and expert finding are useful academic knowledge discovery problems from an academic recommendation point of view. Group level (GL) topic modeling can provide us with richer text semantics and relationships, which results in denser topics. And denser topics are more useful for academic discovery issues in contrast to Element level (EL) or Document level (DL) topic modeling, which produces sparser topics. Previous methods performed academic knowledge discovery by using network connectivity (only links not text of documents), keywords-based matching (no semantics) or by using semantics-based intrinsic structure of the words presented between documents (semantics at DL), while ignoring semantics-based intrinsic structure of the words and relationships between conferences (semantics at GL). In this paper, we consider semantics-based intrinsic structure of words and relationships presented in conferences (richer text semantics and relationships) by modeling from GL. We propose group topic modeling methods based on Latent Dirichlet Allocation (LDA). Detailed empirical evaluation shows that our proposed GL methods significantly outperformed DL methods for conference mining and expert finding problems.  相似文献   

15.
微博用户影响力分析作为社交网络分析的重要组成部分,一直受到研究人员的关注。针对现有研究工作分析用户行为时间性的不足和忽略用户与参与话题之间关联性等问题,提出了一种面向微博话题的用户影响力分析算法——基于话题和传播能力的用户排序(TSRank)算法。首先,基于微博话题分析用户转发行为时间性,进一步构建用户转发和用户博文转发两种话题转发关系网络,预测用户话题信息传播能力;然后,分析用户个人历史微博和背景话题微博文本内容,挖掘用户与背景话题之间的关联性;最后,综合考虑用户话题信息传播能力以及用户与背景话题间关联性计算微博用户影响力。爬取新浪微博真实话题数据进行实验,实验结果表明,话题关联度更高用户的话题转发量明显大于关联度很低的用户,引入用户转发行为时间性相比无转发时间性,TSRank算法的捕获率(CR)提高了18.7%,进一步与典型影响力分析算法WBRank、TwitterRank和PageRank相比,TSRank算法在准确率和召回率上分别提高了5.9%、8.7%、13.1%和6.7%、9.1%、14.2%,验证了TSRank算法的有效性。该研究成果对社交网络的社会属性、话题传播等理论研究以及好友推荐、舆情监控等应用研究具有支撑作用。  相似文献   

16.
基于特定领域的中文微博热点话题挖掘系统BTopicMiner   总被引:1,自引:0,他引:1  
李劲  张华  吴浩雄  向军 《计算机应用》2012,32(8):2346-2349
随着微博应用的迅猛发展,自动地从海量微博信息中提取出用户感兴趣的热点话题成为一个具有挑战性的研究课题。为此研究并提出了基于扩展的话题模型的中文微博热点话题抽取算法。为了解决微博信息固有的数据稀疏性问题,算法首先利用文本聚类方法将内容相关的微博消息合成为微博文档;基于微博之间的跟帖关系蕴含着话题的关联性的假设,算法对传统潜在狄利克雷分配(LDA)话题模型进行扩展以建模微博之间的跟帖关系;最后利用互信息(MI)计算被抽取出的话题的话题词汇用于热点话题推荐。为了验证扩展的话题抽取模型的有效性,实现了一个基于特定领域的中文微博热点话题挖掘的原型系统——BTopicMiner。实验结果表明:基于微博跟帖关系的扩展话题模型可以更准确地自动提取微博中的热点话题,同时利用MI度量自动计算得到的话题词汇和人工挑选的热点词汇之间的语义相似度达到75%以上。  相似文献   

17.
相似用户挖掘是提高社交网络服务质量的重要途径,在面向大数据的社交网络时代,准确的相似用户挖掘对于用户和互联网企业等都有重要的意义,而根据用户自己的兴趣话题挖掘的相似用户更符合相似用户的要求。提出了一种基于用户兴趣话题进行相似用户挖掘的方法。该方法首先使用TextRank话题提取方法对用户进行兴趣话题提取,再对用户发表内容进行训练,计算出所有词之间的相似度。提出CP(Corresponding Position similarity)、CPW(Corresponding Position Weighted similarity)、AP(All Position similarity)、APW(All Position Weighted similarity)四种用户兴趣话题词相似度计算方法,通过用户和相似用户间关注、粉丝重合率验证相似用户挖掘效果,APW similarity的相似用户的关注/粉丝重合百分比为1.687%,优于提出的其他三种算法,分别提高了26.3%、2.8%、12.4%,并且比传统的文本相似度方法Jaccard相似度、编辑距离算法、余弦相似度分别提高了20.4%、21.2%、45.0%。因此APW方法可以更加有效地挖掘出用户的相似用户。  相似文献   

18.
固定标签协同过滤推荐算法,未充分考虑标签因子的多样化,主要依靠人工标记,扩展性不强,主观因素多。本文从用户的喜好特征因素角度出发,在固定标签协同过滤推荐算法的基础上,提出一种隐式标签协同过滤推荐算法。该算法利用LDA主题模型生成项目文本的隐式标签,得到项目-标签特征权重,根据算法性能优化的要求选择标签数量,将项目-标签矩阵与用户评分矩阵结合得到用户对标签的偏好矩阵,最后通过协同过滤算法产生推荐。实验结果表明,本文提出的基于LDA的隐式标签协同过滤推荐算法缓解了数据稀疏性问题,项目推荐的召回率、准确度和F1值有较大提升。  相似文献   

19.
高茂庭  杨涛 《计算机应用研究》2020,37(12):3565-3568,3577
针对弹幕视频网站通常不为用户提供评分功能并且使用弹幕池策略以降低存储压力导致的缺少用户评分和无法准确建模用户主题的问题,提出融合主题模型和协同过滤的弹幕视频推荐算法(DRCFT)。首先根据用户行为构造隐式评分矩阵,并得到项目评分相似度;其次建立LDA主体模型,生成项目主题,计算项目主题相似度;再加权生成综合项目相似度,由此结合评分矩阵计算用户—项目预测评分;然后对项目主题相似度矩阵进行sigmoid惩罚,结合用户历史记录得到用户—项目主题相似度;最后将用户—项目主题相似度作为权重,与预测评分相乘,得到最终的预测评分。对比实验表明,该算法能够得到合理的推荐结果,提高推荐的准确性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号