首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
基于内容的推荐在用户数据较少的情况下是一种有效的解决冷启动的方法。针对基于内容的推荐算法中,内容相似度计算精度低、用户兴趣漂移等问题,提出一种结合影评内容相似度和长短期兴趣模型来计算电影相似度的推荐方法。算法利用text-rank、word2vec等技术和模型对影评进行关键词抽取和词向量构建,同时基于word2vec训练结果进行电影内容相似度计算,一定程度上解决了近义词、网络词等带来的准确率下降问题;然后基于长短期兴趣漂移模型,统计用户对不同内容属性的偏好权重,并随时间窗口动态计算电影相似度矩阵,缓解了用户兴趣随时间漂移而改的问题;最后根据不同推荐策略获得推荐结果。实验结果证明,该算法比对比方法正确率提高了5%左右,同时兴趣模型提取了用户长短期兴趣标签,在工业界及基于标签的算法等场景中都具有很高的实用价值。  相似文献   

2.
ABSTRACT

Twitter has become a popular microblogging service that allows millions of active users share news, emergent social events, personal opinions, etc. That leads to a large amount of data producing every day and the problem of managing tweets becomes extremely difficult. To categorize the tweets and make easily in searching, the users can use the hashtags embedding in their tweets. However, valid hashtags are not restricted which lead to a very heterogeneous set of hashtags created on Twitter, increasing the difficulty of tweet categorization. In this paper, we propose a hashtag recommendation method based on analyzing the content of tweets, user characteristics, and currently popular hashtags on Twitter. The proposed method uses personal profiles of the users to discover the relevant hashtags. First, a combination of tweet contents and user characteristics is used to find the top-k similar tweets. We exploit the content of historical tweets, used hashtags, and the social interaction to build the user profiles. The user characteristics can help to find the close users and enhance the accuracy of finding the similar tweets to extract the hashtag candidates. Then a set of hashtag candidates is ranked based on their popularity in long and short periods. The experiments on tweet data showed that the proposed method significantly improves the performance of hashtag recommendation systems.  相似文献   

3.
Docker has been the mainstream technology of providing reusable software artifacts recently. Developers can easily build and deploy their applications using Docker. Currently, a large number of reusable Docker images are publicly shared in online communities, and semantic tags can be created to help developers effectively reuse the images. However, the communities do not provide tagging services, and manually tagging is exhausting and time-consuming. This paper addresses the problem through a semi-supervised learning-based approach, named SemiTagRec. SemiTagRec contains four components:(1) the predictor, which calculates the probability of assigning a specific tag to a given Docker repository; (2) the extender, which introduces new tags as the candidates based on tag correlation analysis; (3) the evaluator, which measures the candidate tags based on a logistic regression model; (4) the integrator, which calculates a final score by combining the results of the predictor and the evaluator, and then assigns the tags with high scores to the given Docker repositories. SemiTagRec includes the newly tagged repositories into the training data for the next round of training. In this way, SemiTagRec iteratively trains the predictor with the cumulative tagged repositories and the extended tag vocabulary, to achieve a high accuracy of tag recommendation. Finally, the experimental results show that SemiTagRec outperforms the other approaches and SemiTagRec's accuracy, in terms of Recall@5 and Recall@10, is 0.688 and 0.781 respectively.  相似文献   

4.
如何有效利用海量的数据是当前机器学习面临的一个重要任务,传统的支持向量机是一种有监督的学习方法,需要大量有标记的样本进行训练,然而有标记样本的数量是十分有限的并且非常不易获取.结合Co-training算法与Tri-training算法的思想,给出了一种半监督SVM分类方法.该方法采用两个不同参数的SVM分类器对无标记样本进行标记,选取置信度高的样本加入到已标记样本集中.理论分析和计算机仿真结果都表明,文中算法能有效利用大量的无标记样本,并且无标记样本的加入能有效提高分类的正确率.  相似文献   

5.
协同过滤算法(CF)根据用户-物品的评分矩阵做推荐,未考虑物品自身属性。本文将MovieLens数据集上的电影属性,作为影响推荐结果的因素,融合电影的简介、评论、评分、导演和演员等多种因素,进行推荐。使用CNN(卷积神经网络)和Word2Vec(Word to Vector,词向量模型)处理电影简介;使用AFINN(Finn rup Nielsen情感词典)处理评论,并对结果进行映射;对导演和演员数据进行建模,得到该因素下的预测评分,最后将各因素下的结果进行加权融合,通过调整权重,得到最佳效果。经验证,该方法的推荐性能优于传统的CF算法。  相似文献   

6.
传统论文自动推荐算法仅从单视图角度实现分类,缺乏特征融合及多视图语义知识,上下文信息和长距离依赖利用不明显,较难挖掘到深层次文本特征,从而限制学术论文推荐的准确度。针对这些问题,提出了一种基于多视图融合TextRCNN的论文自动推荐模型,该模型融合论文标题、关键词和摘要三个视图特征,利用卷积神经网络(CNN)、双向长短时记忆网络(BiLSTM)和注意力机制构建模型,实现对不同学科方向论文的自动分类及推荐。实验结果表明,设计的论文推荐模型在精确率、召回率和F1值上均有所提升,比机器学习方法平均提高3.40%、3.57%和3.49%,也优于单视图和已有经典的深度学习方法。该方法有效利用多视图知识和上下文语义信息,提高论文推荐的准确率,进而节约科研工作者检索所需论文所花费时间和精力,进一步提高科研人员的效率,推荐符合其研究需求的学术论文,具有良好的学术价值和应用扩展。  相似文献   

7.
传统的协同过滤算法过于依赖用户之间的评分,容易出现冷启动和数据稀疏性问题,同时推荐结果单一,针对以上问题,本文提出了一种融合信任因子的多样化电影推荐算法.首先对用户相似度计算方法进行改进,引入用户间信任度关系和属性特征信息.接着使用聚类方法把具有相同兴趣的用户划分在同一社群.最后在评分时综合考虑用户活跃度对电影的推荐度,引入惩罚因子,从而为目标用户提供个性化、多样化的电影推荐.实验结果表明,本文提出的算法在推荐精度和多样性指标上均有所提高,有较好的推荐效果.  相似文献   

8.
传统协同过滤技术仅使用用户对物品的评分矩阵,没有充分利用用户和物品的其他多种特征,而且由于评分矩阵非常稀疏,导致推荐系统的推荐准确率严重下降。近几年深度学习技术在机器学习的多个领域取得了显著的成就,本文针对传统协同过滤推荐系统的问题,提出一种基于双层注意力机制的深度学习推荐系统。以电影推荐为例,使用深度学习框架处理推荐系统中的多种输入特征信息,同时引入双层注意力机制,分别学习用户和电影每个特征之间的偏好以及用户与其观影列表中每一部电影间的偏好,从而尽可能多地利用用户和电影的特征数据,学习用户的行为偏好,在一定程度上改善了推荐的效果。  相似文献   

9.
为解决在大数据环境下,网络信息快速膨胀导致的“信息过载”问题,即用户无法从海量信息中快速准确获取有用信息。提出在基于Scala语言的Spark平台下,运用基于模型的协同过滤推荐算法,通过分析样本用户对电影的评分数据,建立电影的向量模型,最后根据与实时的用户数据的对比对用户进行电影推荐。实验结果表明基于模型的协同过滤算法的电影推荐系统能够准确地为用户推荐电影信息。  相似文献   

10.
11.
当前图书馆只能向读者提供非常有限的图书推荐服务。本文提出可采用从网上书店获得的大量公开数据作为推荐参考标准的思路,使推荐不再依赖有限的本地数据,而是基于集体智慧。本文提出一个根据图书关联关系网络来评价图书的内容相关性及推荐价值的方法。初步实验结果表明,这一基于集体智慧的图书推荐方法能做出更全面和满意的图书推荐。  相似文献   

12.
宁静  刘杰  叶丹 《计算机科学》2010,37(6):179-185
使用XML Schema能够对XML文档进行有效性验证以及对查询、转换等操作进行优化,但是实际应用中大量XML文档缺失关联的Schema.提出了一种根据XML文档自动提取对应的XML Schema Definition(XSD)的方法XSDInfer,先根据合并规则将XML解析过程中分析得到的模式信息记录在内容模型图中,再根据生成规则将其转化为内容模型表达式,进而得到XSD.XSDInfer能够在内存消耗比较少的情况下快速地处理超大规模、深度嵌套的XML文档,同时支持XSD的上下文相关的内容模型,提取出的XSD也具有更好的可读性.实验表明,与同类方法相比,XSDInfer具有更好的可扩展性和表达能力.  相似文献   

13.
提出一种基于支持向量机的渐近式半监督式学习算法,它以少量的有标记数据来训练初始学习器,通过选择性取样规则和核参数来调节无标记样本的选择范围和控制学习器决策面的动态调节方向,并通过删除非支持向量来降低学习代价。仿真实验表明,只要能够选择适当的选择性取样的阈值和核参数,这种学习算法就能够以较少的学习代价获得较好的学习效果。  相似文献   

14.
分析目前比较流行的两种推荐算法各自存在的优缺点,针对两种单一推荐算法各自的优缺点,提出一种基于定性映射的混合推荐算法模型,以拓扑邻域为定性基准进行邻近查找操作,通过转化程度函数对结果进行优化,提高推荐系统的推荐精度,并通过实验验证该混合算法的可行性和精确性。  相似文献   

15.
基于内容和合作模式的信息推荐机制   总被引:8,自引:0,他引:8  
如何根据用户的兴趣向用户推荐相关信息成为目前研究的热点,本文提出了基于内容和合作模式的信息推荐机制。其基本思想是根据用户所关心的文本内容将用户划分为不同的内容类,同时按照用户的访问模式以及用户评注的一致性,将用户分成不同的合作类。综合考虑其内容类和合作类对于用户评注影响,利用Fisher 判别分析,给出了信息推荐机制,将相关文本推送给用户。此外,随着信息数量的增加和用户的增加,自动调节各项参数,适应系统的变化,同时考虑到系统负荷和响应速度等方面的约束。  相似文献   

16.
推荐系统广泛应用于人们生活的多个领域,日常生活中常见的有电商、电影、音乐和新闻推荐等.推荐系统根据用户的历史偏好主动推送相关的信息,节约了用户的时间,极大地提升了用户的体验.随着大数据技术的发展成熟,数据处理的速度变得更快.该文选取MovieLens电影数据集,并基于大数据分布式处理框架Spark和交替最小二乘法ALS...  相似文献   

17.
基于XCP协议的拥塞控制研究   总被引:4,自引:0,他引:4  
陈卓  刘波 《计算机工程》2006,32(4):147-149
对一种全新的拥塞控制协议XCP(eXplicit Control Protocol)进行了研究。在分析传统TCP的拥塞控制机制不足的基础上,对XCP协议的拥塞头格式进行了剖析,给出了基于XCP协议实现拥塞控制的基本原理。最后通过对比实验,验证了XCP协议在拥塞控制性能上比传统的TCP协议更优越。  相似文献   

18.
谌明  张蕾  马天翼 《软件学报》2021,32(12):3852-3868
数据隐私保护问题已成为推荐系统面临的主要挑战之一.随着《中华人民共和国网络安全法》的颁布和欧盟《通用数据保护条例》的实施,数据隐私和安全成为了世界性的趋势.联邦学习可通过不交换数据训练全局模型,不会泄露用户隐私.但是联邦学习存在每台设备数据量少、模型容易过拟合、数据稀疏导致训练好的模型很难达到较高的预测精度等问题.同时,随着5G (the 5th generation mobile communication technology)时代的到来,个人设备数据量和传输速率预计比当前提高10~100倍,因此要求模型执行效率更高.针对此问题,知识蒸馏可以将教师模型中的知识迁移到更为紧凑的学生模型中去,让学生模型能尽可能逼近或是超过教师网络,从而有效解决模型参数多和通信开销大的问题.但往往蒸馏后的学生模型在精度上会低于教师模型.提出一种面向推荐系统的联邦蒸馏方法,该方法首先在联邦蒸馏的目标函数中加入Kullback-Leibler散度和正则项,减少教师网络和学生网络间的差异性影响;引入多头注意力机制丰富编码信息,提升模型精度;并提出一个改进的自适应学习率训练策略来自动切换优化算法,选择合适的学习率,提升模型的收敛速度.实验验证了该方法的有效性:相比基准算法,模型的训练时间缩短52%,模型的准确率提升了13%,平均误差减少17%,NDCG值提升了10%.  相似文献   

19.
基于流形距离的半监督判别分析   总被引:5,自引:0,他引:5  
魏莱  王守觉 《软件学报》2010,21(10):2445-2453
大量无类别标签的数据具有对分类有用的信息,有效地利用这些信息来提高分类精确度,是半监督分类研究的主要内容.提出了一种基于流形距离的半监督判别分析(semi-supervised discriminant analysis based on manifold distance,简称SSDA)算法,通过定义的流形距离,能够选择位于流形上的数据点的同类近邻点、异类近邻点以及全局近邻点,并依据流形距离定义数据点与其各近邻点之间的相似度,利用这种相似度度量构造算法的目标函数.通过在ORL,YALE人脸数据库上的实验表明,与现有算法相比,数据集通过该算法降维后,能够使基于距离的识别算法具有更高的分类精确度.同时,为了解决非线性降维问题,提出了Kernel SSDA,同样通过实验验证了算法的有效性.  相似文献   

20.
基于路由器解析式模型的NoC网络性能分析方法   总被引:2,自引:1,他引:1  
建立一种高效的片上网络(NoC)性能分析方法对NoC早期的系统设计分析具有重要的指导意义.首先从NoC路由器工作原理出发,对报文传输中的各种阻塞现象进行分析,建立了基于M/G/1/N排队系统的路由器模型;然后提出NoC网络性能分析算法,并且给出了传输延迟、饱和吞吐率等参数的解析表达式.与时钟精度仿真结果比较表明,该方法分析误差约为6.9%,但分析效率提高了约200倍.该方法适用于指导程序NoC拓扑映射,在获取最优映射方案同时,可有效地挖掘网络通信瓶颈.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号