首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
赵蒙  宋俊德  鄂海红 《软件》2013,(12):136-138
随着互联网技术的发展,海量信息同时呈现,使得用户难以有效发现本身感兴趣信息,并且大量的网络暗信息少人问津,难以被普通用户获取,为了处理信息过载问题,出现了个性化用户系统,以弥补海量信息中用户很难找到有用信息的问题。而只有具备了精准的用户兴趣模型,个性化用户系统才得以真正存在。因此用户兴趣建模的研究与探索具有深远的意义。从而,本文首先介绍了社会化标签Tag系统,其次分析了用户兴趣建模的四种表示方法,最后讨论了一种基于社会化标签系统的兴趣建模方法。  相似文献   

2.
信息大爆炸的网络时代,个性化推荐是解决信息“超负载”的有效办法。用户兴趣模型是个性化推荐的核心,关系着整个推荐系统的推荐质量。标签一直被用于资源分类,在个性化推荐方面却很少使用。本文采取向量空间模型的建模方法,利用个性化标签描述用户兴趣,并提出一套简洁有效的标签标准化方法—基于属性共现率的标签标准化以及基于聚类的标签标准化方法对用户的自定义标签进行标准化。该模型能有效降低用户兴趣模型的向量维数,避免分析标签语义的复杂过程,且能够从用户的角度贴切地表达用户兴趣,实验结果表明该模型有助于提高个性化推荐的服务质量。  相似文献   

3.
因特网的出现给人们利用信息带来的极大便利,然而随着信息资源的不断增多,人们利用信息的效率却在不断降低,这就是通常所知的信息过载或者信息迷向问题,介绍了现在比较流行的个性化推荐技术,并对其中核心的建立用户兴趣模型的问题及其涉及的相关技术进行了详细介绍。  相似文献   

4.
随着互联网的飞速发展所带来的“信息过载”问题使准确的新闻推荐技术变得越来越重要。提出基于兴趣标签的个性化新闻推荐系统,利用Hadoop大数据平台,采用基于项的协同过滤算法,通过收集用户的浏览记录和兴趣标签,挖掘用户的主题兴趣,建立用户的兴趣模型,提高个性化推荐系统的准确性和可扩展性,具有良好的推荐效果。  相似文献   

5.
个性化信息检索中,设计用户兴趣模型是一个关键问题.通过分析Web环境下用户的特点和浏览行为,提出一种基于层次向量空间模型的用户兴趣建模和更新方法,以满足用户个性化的服务需求.根据用户对页面的浏览速度来计算用户的兴趣度,使模型便于实现,且更新及时、简单.  相似文献   

6.
互联网用户使用网络获取信息过程中,搜索引擎已成为必不可少的工具。传统的WWW搜索引擎是“提问——搜索”方式.对于所有用户给出同样的关键宇得到的检索结果都是一样的。本文基于传统搜索引擎Google的基础上,实现了个性化的搜索。论文重点阐述了基于向量空间模型的个性化搜索系统的设计和实现过程。系统返回结果能够根据不同用户的兴趣爱好给出用户满意度较好的结果。  相似文献   

7.
微博用户利用标签信息表征其兴趣及属性,通过分析微博用户标签特点以及现有微博推荐方法的局限性,提出一种改进的基于多标签语义关联关系的微博兴趣建模方法。为了解决现有加标方法忽略了语义关联及多标签间关联的问题,首先通过计算标签对在微博用户集合中的共现频率得到标签对语义内联关系;其次构建由标签对连接词组成的路径,通过共享熵进一步计算标签对语义外联关系;最后将两者结合得到标签对语义关联关系矩阵,由此来对用户 标签矩阵进行更新,得到基于多标签语义关联关系的微博用户兴趣模型。以新浪微博公开API抓取的大量微博信息作为实验数据,进行了一系列的实验和分析,结果表明本文构建的用户兴趣模型具有较好的性能。  相似文献   

8.
在分析个性化搜索引擎的基础上,提出一种构建用户兴趣模型的方法.该方法综合考虑用户注册兴趣及浏览行为,将用户兴趣分为长期兴趣和短期兴趣并通过兴趣树进行存储.遗忘机制的引入保证模型能够及时准确地反映用户兴趣.模拟实验表明,本文提出的用户兴趣模型能够有效地提高检索效率,使搜索结果更好地满足用户个性化需求.  相似文献   

9.
个性化信息检索系统的实时性关键在于如何动态更新用户兴趣模型。针对原有方法的不足,改进用户兴趣模型的描述与更新方式。首先根据网页文档的特征改进TF-IDF(Term Frequency-Inverse Document Frequency)算法,以此作为用户兴趣特征词的权重,同时通过引入领域本体,将用户兴趣特征项进行语义扩展,并根据用户浏览行为,改进其用户兴趣主题计算方式,并在此基础上提出用户兴趣模型的更新与遗忘机制。实验对比结果表明,该方法能够捕捉用户兴趣的变化,进一步提高个性化信息检索的准确度与用户满意度。  相似文献   

10.
利用来自Delicious的数据集,结合内容相似度的挖掘和语义关系处理,对社会化标签系统的用户推荐的算法进行了研究.具体工作为:利用标签和书签的语义关系,定义用户的内容信息,从而计算内容相似度;建立内容相似度与社会网络的用户链接关系,通过可重启的随机游走算法(RWR)结合来达成理想的效果.实验评测显示,无论是精确度还是召回率,该算法的效果都要明显优于baseline的算法.  相似文献   

11.
吴不晓  肖菁 《计算机应用》2015,35(6):1663-1667
目前多数社交网络主要根据已有好友关系推荐潜在好友,用户的兴趣爱好不作为主要考虑因素;此外,如何从大量数据中精确地提取用户的兴趣爱好是一项十分艰巨的任务。为此,提出一种在大量标注行为数据中精确挖掘出用户的兴趣爱好,并据此推荐具有相同兴趣爱好的潜在好友的算法--基于标注的好友推荐(FRBT)算法。首先使用词频-逆向文件频率(TF-IDF)对标签进行聚类,将语义相似的标签聚成话题;然后在话题的基础上提出一种新的相似度公式来计算用户相似度;再融合基于话题与基于物品的用户相似度,将相似度较高的用户作为潜在好友进行推荐。在Delicious数据集上以准确率和召回率为指标与item、tag和tri-graph三种算法进行比较,实验验证了该算法能够更准确地为用户推荐兴趣相似的好友。  相似文献   

12.
针对为项目自动推荐评审专家的任务特点,提出一种基于主题信息的专家推荐方法。在分析项目与专家描述文档的属性特点后,使用隐含狄利克雷分配模型获取文档内容的主题词,通过统计主题词词频的方法构建主题特征空间,并结合文档属性栏目的重要性因素,利用TF-IDF特征提取算法分别获得项目文档与专家文档的主题特征向量,采用改进的相似度算法计算项目与专家主题特征向量的相关度,并选择与项目相关度较高的专家作为推荐结果。实验结果表明,该方法的推荐效果优于使用TF-IDF+余弦相似度计算的推荐方法,准确率、召回率和综合评价指标F值平均提高了4.87%,5.04%和4.97%。  相似文献   

13.
应用来自Delicious的数据集, 通过对精确度和召回率等指标的测评, 研究了协同矩阵分解对社会化标签系统中资源推荐的有效性问题, 由于用户、资源、标签之间具有一定的相似性, 采用了通过同时分解三者在不同方向的潜在兴趣值, 对用户推荐其潜在兴趣方向相近的资源的方法。与协同过滤、图结构分析的结果进行了对比, 研究结果表明该方法要优于其他方法。为了证明协同矩阵分解的有效性, 对正规化、学习率、UT因子和IT 因子等各个变量也进行了参数敏感度分析。  相似文献   

14.
基于隐式反馈的自适应用户兴趣模型   总被引:1,自引:0,他引:1       下载免费PDF全文
针对现有用户兴趣模型在模型建立以及更新阶段漂移策略的缺陷,设计了一种改进的基于隐式反馈的自适应用户兴趣模型。并将该模型与遗忘策略模型、滑动时间窗口模型和固定比例模型,做了精确率的对比实验,实验结果显示该模型的性能优于其他三个模型。  相似文献   

15.
基于向量空间模型的Web服务发现方法   总被引:1,自引:0,他引:1       下载免费PDF全文
现有服务发现方法大多按照统计概率方式计算服务相关度,不能较准确地反映查询和服务之间的语义关联。针对该不足,提出一种基于向量空间模型的Web服务发现方法。引入WordNet词典进行同义词向量建模,划分服务主题和服务内容,得到新的服务相关度计算公式,并实现Web服务发现原型系统。实验结果表明,该方法具有较高的查准率和查全率,其调和平均值始终保持在0.6以上。  相似文献   

16.
传统的基于向量空间模型的软件缺陷分派方法,由于存在特征空间维度高、数据稀疏且包含噪音等问题,分派准确率较低。为此,提出一种基于隐含狄利克雷分配(LDA)主题模型的软件缺陷分派方法,将缺陷报告从原始的高维文本单词空间映射到低维语义主题空间,在新的低维主题空间上进行分派。实验结果表明,在使用SVM和KNN分类器时,该方法的分派准确率较高。  相似文献   

17.
分析了潜在语义模型,研究了潜在语义空间中文本的表示方法,提出了一种大容量文本集的检索策略。检索过程由粗粒度非相关剔除和相关文本的精确检索两个步骤组成。使用潜在语义空间模型对文本集进行初步的筛选,剔除非相关文本;使用大规模文本检索方法对相关文本在段落一级进行精确检索,其中为了提高检索的执行效率,在检索算法中引入了遗传算法;输出这些候选的段落序号。实验结果证明了这种方法的有效性和高效性。  相似文献   

18.
为了解决传统主题爬虫效率偏低的问题,传统主题爬虫会选择最有价值的链接进行访问,仅简单地计算链接的相关性,却忽视待分析URL之间的相关性关系,致使主题爬虫爬取效率较低。提出一种基于链接模型的相关性判别算法,综合利用有标种子URL和无标的待判别URL实现对无标URL的相关性判别,并推导出迭代初值选取对结果的不敏感性。实验结果表明,与传统的网络爬虫算法相关性判别方法相比,提出的方法效率更高。  相似文献   

19.
詹天晟  陈德华  乐嘉锦  王梅 《计算机应用》2014,(Z2):126-129,139
针对互联网搜索引擎环境中,基于海量搜索历史数据分析用户兴趣的问题,提出一种改进的用户兴趣模型。该模型根据用户搜索的历史数据,结合向量空间模型( VSM )和TF-IDF算法,递归地回溯出用户兴趣权重列表。为解决用户兴趣变化和时间性能的问题,该模型引入时间遗忘机制进行动态更新,并在Hadoop分布式系统架构下利用MapReduce分布式编程模型进行实现。实验结果表明,改进的用户兴趣模型的查准率和召回率都能达到50',具有较好的可行性和可用性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号