首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 906 毫秒
1.
传统的协同过滤推荐算法存在普遍的数据稀疏性问题;应用于推荐算法领域的异构信息网络模型对对象的相似关系认定通常是对称的,这种对称关系的认定在实际问题的处理中存在局限性。为解决上述问题,提出一种非对称异构信息网络的模糊推荐算法。该算法利用模糊集理论在处理用户喜好程度方面的优势,从模糊的信息种获取用户的准确偏好,根据异构信息网络中元路径的丰富语义信息,获取不同角度的用户关联,在相似度计算中引入对象关系的非对称系数,对不同特征元路径的计算结果进行加权,以此提高用户之间相似关系的准确度,通过矩阵分解的方法实现评分预测。实验结果表明,该算法有效解决了数据稀疏性问题,提升了推荐精度。  相似文献   

2.
针对传统协同过滤算法在用户推荐过程中数据稀疏性、可扩展性、用户兴趣迁移变化等问题,提出一种基于异构信息网络的模糊贴近度推荐算法。在k-means聚类算法基础上构建新的异构信息网络,利用关系抽取的方式构造用户属性权重矩阵;引入模糊贴近度综合分析元路径属性权重的影响,寻找近邻用户;采用Top-N算法排序进而完成推荐,并进行准确性验证。在Epinions数据集上的实验结果表明,在推荐质量和速度上,所提推荐算法较传统推荐算法更优。  相似文献   

3.
过去基于学习用户和物品的表征向量的推荐系统算法在大规模数据中取得了较好的结果。相比早期经典的基于矩阵分解(matrix factorization,MF)的推荐算法,近几年流行的基于深度学习的方法,在稀疏的数据集中具有更好的泛化能力。但许多方法只考虑了二维的评分矩阵信息,或者简单的对各种属性做嵌入表征,而忽略了各种属性之间的内部关系。异构信息网络(heterogeneous information network,HIN)相比同构网络能够存储更加丰富的语义特征。近几年结合异构信息网络与深度学习的推荐系统,通过元路径挖掘关键语义信息的方法成为研究热点。
为了更好地挖掘各种辅助信息与用户喜好的关联性,本文结合张量分解、异构信息网络与深度学习方法,提出了新的模型hin-dcf。首先,基于数据集构建特定场景的异构信息网络;对于某一元路径,根据异构图中的路径信息生成其关联性矩阵。其次,合并不同元路径的关联性矩阵后,得到包含用户、物品、元路径三个维度的张量。接着,通过经典的张量分解算法,将用户、物品、元路径映射到相同维度的隐语义向量空间中。并且将分解得到的隐语义向量作为深度神经网络的输入层的初始化。考虑到不同用户对不同元路径的关联性偏好不同,融入注意力机制,学习不同用户、物品,与不同元路径的偏好权重。在实验部分,该模型在精确度上有效提升,并且更好地应对了数据稀疏的问题。最后提出了未来可能的研究方向。  相似文献   

4.
薛建宇  刘献忠 《计算机应用》2021,41(z1):101-107
与传统的协同过滤推荐算法相比,概率矩阵分解(PMF)模型在大型、稀疏的数据集上表现良好,但其仅利用了用户对项目的评分信息,没有充分考虑用户和项目的特征,因此在推荐准确度等方面仍具有很大的提升空间.基于概率矩阵分解模型,融合用户属性特征、用户偏好特征和项目标签特征,提出一种新的推荐算法UFIF-PMF.首先,根据用户属性信息计算用户属性相似度,利用项目标签信息和用户评分信息计算用户偏好相似度,并通过加权构建用户相似度矩阵;然后,构建基于项目标签信息的项目相似度矩阵;接着,将用户相似度矩阵和项目相似度矩阵融入到概率矩阵分解模型中;最后,在电影公开数据集Movielens上进行模型训练和对比实验.实验结果表明,在训练集比例为90%、隐性特征维度为10的情况下,与PMF、基于用户偏好的概率矩阵分解推荐算法(USPMF)和融合物品相似度的概率矩阵分解推荐算法(ISPMF)相比,UFIF-PMF算法的均方根误差(RMSE)分别下降6.27%、3.65%和3.49%,平均绝对误差(MAE)分别下降8.46%、4.8%和4.67%,同时有效缓解了推荐系统的冷启动和数据稀疏问题,有较强的可扩展性.  相似文献   

5.
融合用户评分与显隐兴趣相似度的协同过滤推荐算法   总被引:1,自引:0,他引:1  
协同过滤算法是推荐系统中使用最广泛的算法,其核心是利用某兴趣爱好相似的群体来为用户推荐感兴趣的信息。传统的协同过滤算法利用用户-项目评分矩阵计算相似度,通过相似度寻找用户的相似群体来进行推荐,但是由于其评分矩阵的稀疏性问题,对相似度的计算不够准确,这间接导致推荐系统的质量下降。为了缓解数据稀疏性对相似度计算的影响并提高推荐质量,提出了一种融合用户评分与用户显隐兴趣的相似度计算方法。该方法首先利用用户-项目评分矩阵计算用户评分相似度;然后根据用户基本属性与用户-项目评分矩阵得出项目隐性属性;之后综合项目类别属性、项目隐性属性、用户-项目评分矩阵和用户评分时间,得到用户显隐兴趣相似度;最后融合用户评分相似度和用户显隐兴趣相似度得到用户相似度,并以此相似度寻找用户的相似群体以进行推荐。在数据集Movielens上的实验结果表明,相比传统算法中仅使用单一的评分矩阵来计算相似度,提出的新相似度计算方法不仅能够更加准确地寻找到用户的相似群体,而且还能够提供更好的推荐质量。  相似文献   

6.
推荐系统中的辅助信息可以为推荐提供有用的帮助,而传统的协同过滤算法在计算用户相似度时对辅助信息的利用率低,数据稀疏性大,导致推荐的精度偏低.针对这一问题,本文提出了一种融合用户偏好和多交互网络的协同过滤算法(NIAP-CF).该算法首先根据评分矩阵和项目属性特征矩阵挖掘出用户的项目属性偏好信息,然后使用SBM方法计算用户间的项目属性偏好相似度,并用其改进用户相似度计算公式.在进行评分预测时,构建融合用户-项目属性偏好信息的多交互神经网络预测模型,使用动态权衡参数综合由用户相似度计算出的预测评分和模型的预测评分来进行项目推荐.本文使用MovieLens数据集进行实验验证,实验结果表明改进算法能够提高推荐的精度,降低评分预测的MAE和RMSE值.  相似文献   

7.
随着互联网信息的不断膨胀,互联网已经进入了大数据时代。为了解决人们当前面临的信息过载问题,个性化推荐系统应运而生,系统核心是其所使用的推荐算法。slope one算法是一种简单高效的典型协同过滤推荐算法,算法通过对用户——项目评分矩阵进行线性回归,预测用户对于未评分项目的可能评分。由于算法的输入只有用户评分矩阵,而实际情况中的评分矩阵通常较为稀疏,因此数据稀疏性是影响其推荐准确率的主要问题。为了克服该问题,文章基于现有研究提出了一种改进的slope one算法。该算法根据所有用户对项目的历史评分计算其项目相似度,然后将其加入评分公式予以修正,同时针对稀疏的评分矩阵使用奇异值分解技术降低矩阵维度,生成更加稠密的相似矩阵作为slope one核心计算部分的输入。项目相似度的引入增加了算法对于项目内在联系的考虑,推荐结果更加合理。而奇异值分解则可以使稀疏的评分矩阵转换为更适用于算法计算的形式。通过项目相似性和奇异值分解两种技术的融合,文中算法实现了更好的推荐准确性和适应性。  相似文献   

8.
异质信息网络(HIN)包含丰富的网络结构和语义信息使其常见于推荐系统中。然而,当前推荐系统的研究工作主要是基于元路径提供的间接信息进行推荐,而未充分利用直接交互信息。为了充分利用这些信息,提出一种融合注意力机制和异质信息网络元路径的三元交互模型(AMMRec)。在异质信息网络中使用隐式反馈矩阵构造用户相似度矩阵和项目相似度矩阵,运用异质信息网络的表示学习方法获得对应的特征向量嵌入,通过注意力机制对其进行修正;设计注意力神经网络,将不同元路径的表示向量进行融合;拼接用户嵌入、元路径嵌入和项目嵌入,通过全连接神经网络生成推荐结果。在真实数据集上的实验结果表明,AMMRec的推荐精度最高提升了9.5%。此外,AMMRec对推荐结果具有良好的可解释性。  相似文献   

9.
《微型机与应用》2022,(1):84-89
推荐系统是数据挖掘中强有力的技术,异构信息网络是推荐系统起步晚却发展迅猛的主流推荐方法。提出了基于异构信息网络的学生成绩预测与预警模型,该方法通过元路径计算得到学生间相似度矩阵,利用相似度矩阵构造成绩变化趋势矩阵和幅度矩阵,投票得到学生成绩预警与预测结果;最后,在公开数据集上验证所提模型的有效性,结果表明,该模型能够对学生成绩进行预警,并能在一定阈值下预测学生成绩具体分值。  相似文献   

10.
传统基于用户的协同过滤推荐算法在计算用户相似性时经常面临数据稀疏的问题,同时忽略了不同评分项目之间的差异。针对这些问题,提出一种基于FunkSVD矩阵分解和相似度矩阵的推荐算法。利用用户评分数据与物品标签数据计算出用户的相似度矩阵;利用FunkSVD对得到的相似度矩阵进行矩阵分解,生成新的用户相似度矩阵;根据用户之间评分数据对两个相似度矩阵中的用户相似度加权组合,并生成用户的综合相似度矩阵来对用户进行评分预测。经过Movielens数据集的实验表明,该算法提高了预测的准确性,优于传统的推荐算法。  相似文献   

11.
问答社区中候选答案过多会增加提问用户选择最佳答案的负担。为此,提出一种基于概率潜在语义分析(PLSA)模型的自动答案选择方法。在主题建模思想的基础上,利用问答社区中的用户资料,以PLSA模型表达问答社区中的用户兴趣分布,依据答案和问题之间的主题匹配度对候选答案进行排序。实验结果表明,该方法可有效挖掘用户兴趣,提高答案选择的准确率。  相似文献   

12.
近年来,随着互联网的普及和知识爆炸性的增长,社区问答网站积累了大量的用户和内容,同时也产生了大量的低质量文本,极大地影响了用户检索满意答案的效率,因此如何提升答案质量预测的性能十分重要。目前,社区问答答案质量预测方面的研究大都是使用点方式(pointwise)来实现分类模型,但由于问题的难度不同,对答案的要求也有所差异,使用点方式会忽略掉部分答案的特点,所以该文使用点对方式(pairwise)来预测答案质量。另外,已有的研究工作表明,社区问答中同一问题下的答案数量特征对答案质量预测没有效果,甚至有冗余作用。对于时间差也有相同的结论,即不能提升预测性能。该文提出了一种将上述两者结合在一起的新特征,实验结果表明,该特征能显著提高社区问答答案质量预测的性能。  相似文献   

13.
在Stack Overflow、Quora等社区问答网站中,日益增长的用户数使新问题数量急剧增加,传统的专家发现方法通常根据历史回答记录建立用户文档,再从中提取用户文本特征,难以及时寻找到合适的专家进行回答。针对该问题,提出一种社区问答中基于用户-标签异构网络的专家发现方法。根据用户历史回答记录和问题的附带标签构建用户-标签网络,以此得到用户的向量表示。在此基础上,使用全连接神经网络提取用户特征和问题文本特征,通过比较两者的余弦相似度得到候选专家列表。基于StackExchange的真实世界数据集进行测试,实验结果表明,与LDA、STM、RankingSVM和QR-DSSM方法相比,该方法的MRR指标值较高,能够准确寻找到可提供正确答案的专家。  相似文献   

14.
自动问答系统可以帮助人们快速从海量文本中提取出有效信息,而答案选取作为其中的关键一步,在很大程度上影响着自动问答系统的性能.针对现有答案选择模型中答案关键信息捕获不准确的问题,本文提出了一种融合语义信息与问题关键信息的多阶段注意力答案选取模型.该方法首先利用双向LSTM模型分别对问题和候选答案进行语义表示;然后采用问题的关键信息,包括问题类型和问题中心词,利用注意力机制对候选答案集合进行信息增强,筛选Top K个候选答案;然后采用问题的语义信息,再次利用注意力机制对Top K个候选答案集合进行信息增强,筛选出最佳答案.通过分阶段地将问题的关键信息和语义信息与候选答案的语义表示相结合,有效提高了对候选答案关键信息的捕获能力,从而提升了答案选取系统的性能.在三个数据集上对本文所提出的模型进行验证,相较已知同类最好模型,最高性能提升达1.95%.  相似文献   

15.
答案选择是自动问答系统中的关键任务之一,其主要目的是根据问题与候选答案的相似性对候选答案进行排序,并选择出相关性较高的答案返回给用户。可将其看作成一个文本对的匹配问题。该文利用词向量、双向LSTM、2D神经网络等深度学习模型对问题—答案对的语义匹配特征进行了提取,并将其与传统NLP特征相结合,提出一种融合深度匹配特征的答案选择模型。在Qatar Living社区问答数据集上的实验显示,融合深度匹配特征的答案选择模型比基于传统特征的模型MAP值高5%左右。  相似文献   

16.
矩阵分解的推荐模型具有推荐精度高和易扩展等特点,已成为目前融合社交信息构建推荐系统的主要模型,但在分解过程中,用户偏好矩阵和物品特征矩阵初始赋值的随机性影响了推荐的性能,忽略了物品以及用户之间隐含的联系与区别。为此,提出一种基于社交信息的矩阵分解改进算法。将评分值分别与社交信息和物品的特征属性相结合,构建用户相似网络与物品相似网络,同时应用社区划分充分挖掘用户、物品之间的潜在关系,并按不同类型节点的近邻差异性,通过建立核心、非核心节点的偏好向量与特征向量得到矩阵分解初始矩阵。在公开数据集上的实验结果表明,该算法的推荐性能优于MF、SR2等同类型算法,运行迭代次数明显降低。  相似文献   

17.
盛俊  李斌  陈崚 《计算机应用》2020,40(9):2606-2612
针对基于网络信息的商品推荐的问题,提出了在二部网络上基于社区挖掘和标签传递的推荐算法。首先,用带权的二部图来表达用户-项目的评分矩阵,利用标签传递技术对二部网络进行社区挖掘;然后,基于二部网络中的社区结构信息,充分利用用户所在的社区之间的相似性以及项目之间、用户之间的相似性来挖掘用户可能感兴趣的项目;最后,向用户进行项目的推荐。在实际网络上的实验结果表明,与基于双向关联规则项目评分预测的推荐算法(BAR-CF)、基于项目评分预测的推荐算法(IR-CF)、基于网络链接预测的用户偏好预测方法(PLP)和改进的基于用户的协同过滤的方法(MU-CF)相比,该算法的平均绝对差(MAE)低0.1~0.3,准确率高0.2。因此,所提算法可以取得比其他类似方法更高质量的推荐结果。  相似文献   

18.
盛俊  李斌  陈崚 《计算机应用》2005,40(9):2606-2612
针对基于网络信息的商品推荐的问题,提出了在二部网络上基于社区挖掘和标签传递的推荐算法。首先,用带权的二部图来表达用户-项目的评分矩阵,利用标签传递技术对二部网络进行社区挖掘;然后,基于二部网络中的社区结构信息,充分利用用户所在的社区之间的相似性以及项目之间、用户之间的相似性来挖掘用户可能感兴趣的项目;最后,向用户进行项目的推荐。在实际网络上的实验结果表明,与基于双向关联规则项目评分预测的推荐算法(BAR-CF)、基于项目评分预测的推荐算法(IR-CF)、基于网络链接预测的用户偏好预测方法(PLP)和改进的基于用户的协同过滤的方法(MU-CF)相比,该算法的平均绝对差(MAE)低0.1~0.3,准确率高0.2。因此,所提算法可以取得比其他类似方法更高质量的推荐结果。  相似文献   

19.
The traditional search engines return a large number of relative web pages rather than accurate answers. However, in a question answering system, users could use sentences in daily life to raise questions. The question answering system will analyze and comprehend these questions and return answers to users directly. Aiming at the problems in current network environment, such as low precision of question answering, imperfect expression of domain knowledge, low reuse rate and lack of reasonable theory reference models, we put forward the information integration method of semantic web based on pervasive agent ontology (SWPAO) method, which will integrate, analyze and process enormous web information and extract answers on the basis of semantics. With SWPAO method as the clue, we mainly study the method of concept extraction based on uniform semantic term mining, pervasive agent ontology construction method on account of multi-points and the answer extraction in view of semantic inference. Meanwhile, we present the structural model of the question answering system applying ontology, which adopts OWL language to describe domain knowledge base from where it infers and extracts answers by Jena inference engine, thus the precision of question answering in QA system could be improved. In the system testing, the precision has reached 86%, and recalling rate is 93%. The experiment indicates that this method is feasible and it has the significance of reference and value of further study for the question answering systems.  相似文献   

20.
传统自动问答方法通常依赖谓词等先验信息实现知识库问答,需要耗费较多的人力且泛化能力不佳。提出一种针对弱依赖信息的知识库问答方法,结合BERT与BiLSTM-CRF网络提取问句中的命名实体,定位知识库中与该实体相关的三元组信息,通过答案匹配网络为三元组集合中的答案标上相似度分数,使用阈值选择策略选取符合要求的答案集合,并按照相似度分数由高到纸排序后呈现给用户。实验结果表明,该方法弱化了对先验信息的依赖,在减少人工干预的同时保证了问答质量,并且在NLPCC-ICCPOL-2016KBQA数据集上取得了87.05%的F1分数。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号