共查询到20条相似文献,搜索用时 750 毫秒
1.
2.
3.
个性化搜索引擎的研究与设计 总被引:4,自引:1,他引:3
个性化搜索引擎是一种通过机器主动学习用户兴趣,并根据用户兴趣帮助用户进行信息筛选的新一代智能化搜索引擎.在对第二代搜索引擎分析的基础上,运用向量空间模型,设计并实现了一个完整的可学习用户兴趣并可动态调整的个性化搜索引擎.在应用向量空间模型的过程中对经典的相似度算法进行了改进和简化,同时对于关键词的学习与提取以及个性化计算的动态调整提出了若干有益的方法. 相似文献
4.
5.
6.
当前搜索引擎用户个性化的研究是搜索引擎优化的一个研究分支.当前检索模型的主要弊端就是搜索引擎用户提供的信息很少.目前主要借助于用户在和元搜索引擎交互的过程中提供的隐反馈信息对成员搜索引擎的数据源选择算法进行优化,利用语言模型对用户检索行为建模,用户与元搜索引擎交互的过程中动态更新用户行为模型,自适应的满足不同检索动机的用户的信息需求. 相似文献
7.
8.
随着网络信息资源的迅速增加,如何及时准确地获取所需信息是现代网络信息过滤技术需要解决的主要问题.为了给用户提供更准确的信息,提出了一种基于用户反馈的智能合作过滤模型(Agent collaborative filtering model based on users'feedback,ACFM)和用户兴趣模型,该模型通过隐式反馈和显式反馈这两种用户兴趣反馈学习实现合作过滤.实验结果表明,ACFM在预测用户兴趣的效果和推荐搜索信息的准确率方面比传统的搜索引擎有明显改善. 相似文献
9.
针对搜索引擎存在的问题和刑罚信息检索的特定需要,提出了一个元搜索引擎模型,通过元搜索引擎为用户提供统一的访问服务,运用聚类方法对搜索引擎的返回结果进行快速分类,并通过用户的行为反应探视用户的兴趣,动态调整聚类结果,帮助用户快速检索到相关信息.提高了检索的有效性、查准率和查全率,实现了刑罚信息的个性化检索. 相似文献
10.
11.
目前,微博搜索大多应用向量空间模型计算查询词与文档间的相关程度,通常使用TF-IDF(termfrequency-inverse document frequency)统计方法来确定词的权重.然而仅使用词进行微博搜索并不能检测到某条微博的信息含量,而这些往往是查询用户所关注的问题.为此提出了一种基于分析特征与动态步长的微博排序学习算法.首先,定义了一些微博分析特征,经过统计分析获得的这些分析特征可以用来预测用户行为;其次,在此基础上,提出了以词性为单位计算微博相关度的方法,结合信息熵计算方法得到微博词性信息的含量,并用来预测该微博的信息含量;最后,在现有ListNet排序学习算法的基础上,引入了动态步长的概念,对步长进行了动态优化,最终形成了一种基于动态步长的微博排序学习算法——RDLS(ranking based on dynamic learning stepsize)算法.实验结果表明,无论是基于直接特征还是加入分析特征,在相同迭代轮数情况下,相比ListNet算法,RDLS 算法可以训练出更优的模型,在微博排序方面有更好的表现. 相似文献
12.
目的:互联网信息量的急速增长使得人们需要花费大量时间从搜索引擎召回的结果中浏览自身感兴趣的内容,结合用户的搜索日志信息和社交平台信息,提出一种分层的实时偏好挖掘模型,为用户提供个性化搜索服务。方法:在系统分析偏好挖掘的国内外研究现状的基础上,针对足球视频,提出一种分层权重无向图(Hierarchical Weighted Undirected Graph,HWUG)用户偏好模型,充分考虑了用户偏好之间的关联信息,通过获取用户足球领域的显式和隐式反馈信息,提取反馈信息中的偏好标签和偏好动作,并引入时间衰减因子,实现了用户足球偏好的实时计算。结果:算法已经应用在在搜球网(www.findball.net)的个性化检索结果排序和视频推荐上,并已经取得了很好的效果。结论:实验结果表明,结合特定领域的知识,基于分层无向权重图模型的偏好挖掘算法能更准确和实时反映用户的足球偏好。 相似文献
13.
随着Web信息的快速增长和人们对信息检索质量要求的提高,传统的搜索引擎已不能很好地满足人们的需求. 本文提出了一种个性化元搜索引擎模型.个性化是指模型可以针对不同的用户建立不同的用户兴趣模型,然后根据用户兴趣,模型对搜索结果进行过滤、重排序处理,使得显示给用户的搜索结果更具有针对性.本文阐述了各主要功能模块工作原理,并详细介绍了根据用户兴趣模型对搜索结果进行排序的算法,实验表明该算法能够有效地提高用户的检索质量. 相似文献
14.
This paper describes the implementation of evolutionary techniques for information filtering and collection from the World Wide Web. We consider the problem of building intelligent agents to facilitate a person's search for information on the Web. An intelligent agent has been developed that uses a metagenetic algorithm in order to collect and recommend Web pages that will be interesting to the user. The user's feedback on the agent's recommendations drives the learning process to adapt the user's profile with his/her interests. The software agent utilizes the metagenetic algorithm to explore the search space of user interests. Experimental results are presented in order to demonstrate the suitability of the metagenetic algorithm's approach on the Web. 相似文献
15.
针对动态在线任务分配策略难以有效利用历史数据进行学习、同时未考虑当前决策对未来收益的影响的问题,提出基于深度强化学习的空间众包任务分配策略.首先,以最大化长期累积收益为优化目标,基于马尔科夫决策过程从单个众包工作者的角度建模,将任务分配问题转化为对状态动作价值Q的求解及工作者与任务的一对一分配.然后采用改进的深度强化学... 相似文献
16.
17.
麻将作为典型的非完备信息博弈游戏主要通过传统Expectimax搜索算法实现,其剪枝策略与估值函数基于人工先验知识设计,存在假设不合理等问题。提出一种结合Expectimax搜索与Double DQN强化学习算法的非完备信息博弈算法。在Expectimax搜索树扩展过程中,采用Double DQN输出的估值设计估值函数并在限定搜索层数内获得分支估值,同时设计剪枝策略对打牌动作进行排序与部分扩展实现搜索树剪枝。在Double DQN模型训练过程中,将麻将信息编码为特征数据输入神经网络获得估值,使用Expectimax搜索算法得到最优动作以改进探索策略。实验结果表明,与Expectimax搜索算法、Double DQN算法等监督学习算法相比,该算法在麻将游戏上胜率与得分更高,具有更优异的博弈性能。 相似文献
18.
随着Web Services技术的不断成熟和发展,存储在UDDI Registry中的Web Service信息将会变得越来越庞大,如何从UDDI Registry浩如烟海的信息资源中为用户快速、方便、准确地检索出满足需求的Web Service,将变得十分重要.而传统的基于关键词匹配的检索技术已不能满足用户准确而全面定位信息的要求.因此,以Web Service的文本描述信息为研究对象,运用文本挖掘相关方法,构建出用户概念空间,对用户提出的查询要求进行概念检索.着重介绍了用户概念空间的构建方法以及概念检索的匹配运算过程,并给出了应用于UDDI Registry的一种智能检索引擎系统模型. 相似文献
19.
基于用户兴趣的搜索引擎 总被引:1,自引:0,他引:1
随着WWW的出现和发展,Internet上出现的信息迅速增长.如何从大量的信息中获取有用的信息,正成为信息领域的关键技术.传统的搜索引擎没有考虑不同用户的兴趣,因此搜索出来的结果往往无法满足不同用户的特定需求.提出一种用户兴趣模型,能够有效表示用户兴趣,并对传统搜索引擎的搜索结果进行匹配度计算,从而将符合用户兴趣的结果返回给用户.基于这种模型开发了一个基于用户兴趣的法律领域的搜索引擎MyLaw. 相似文献
20.
在使用反距离加权法(Inverse Distance Weighted method,IDW)对土壤重金属含量进行预测时,算法中的超参数一般由先验知识确定,一定程度上存在不确定性。针对这一问题,提出了一种状态值再利用的竞争深度Q学习网络算法以精确估计IDW的超参数。该算法在训练时,将每轮训练样本中的奖励值进行标准化后,与Dueling-DQN中Q网络的状态值结合形成新的总奖励值,然后将总奖励值输入到Q网络中进行学习,从而增强了状态与动作的内在联系,使算法更加稳定。最后使用该算法在IDW上进行超参数学习,并与几种常见强化学习算法进行对比实验。实验表明,提出的RSV-DuDQN算法可以使模型更快收敛,同时提升了模型的稳定性,还可以更准确地得到IDW的参数估计。 相似文献