首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
数字图书馆个性化信息检索模型研究*   总被引:3,自引:0,他引:3  
结合向量空间技术、Agent技术、Web日志挖掘等技术提出了一个基于概念的数字图书馆个性化信息检索模型。该模型根据用户主动提供的初始信息建立基于概念的用户兴趣模型,利用用户对文档的主动评价和用户的访问行为更新用户兴趣模型,并将用户兴趣模型用于检索结果的相关度排序和最新信息的推荐以及合作推荐。最后给出系统的实现方法。  相似文献   

2.
西太平洋地区医学索引设计与实施   总被引:1,自引:0,他引:1  
分析西太平洋地区生物医学期刊分布现状,制定生物医学期刊题录信息的采集策略,并采用基于概念的赋词方法为题录信息建立索引,利用空间向量模型设计基于MeSH的生物医学题录数据扩展检索算法。最后将该算法运用到WPRIM系统的设计与开发中,实验证明能够提高系统检索的召回率。  相似文献   

3.
基于合作信息查寻与检索理论模型构建的相关研究工作综述发现语境在合作查寻与检索过程中居于重要地位。在详细分析语境内涵并对比相关概念的基础上,指出语境在合作信息查寻与检索研究中具有方法论属性,并提出以语境为基础的合作信息查寻与检索5C模型。基于5C模型探讨合作信息查寻与检索的路径选择,并揭示其语境运行机制。  相似文献   

4.
基于中文自然语言理解的知识检索模型   总被引:6,自引:0,他引:6  
基于中文自然语言理解的知识检索模型的设计思路是:通过对用户提问及Web文档信息进行语义层次的自然语言处理,构建概念和概念网络,针对用户真实查询需求与概念网络及其映射的源文档进行推理匹配,然后对检索结果进行排序处理,提交给用户。图2。参考文献5。  相似文献   

5.
电子文档和用户的增长导致了信息检索结果个性化模式的创新,从而更好地为用户偏好服务.个性化的内容检索旨在改善检索过程中考虑个别用户的特殊兴趣.本文提出了一种基于扩展模糊概念网的信息检索结果的个性化的新方法.在这种方法中,网页和用户偏好都将以扩展模糊概念网形式表示.扩展模糊概念网可看作是关系矩阵和关联矩阵模型,关系矩阵中的元素代表模糊概念间的关系,关联矩阵中的元素表明概念间的关联度.这种方法的好处是能找到用户查询的绝大多数文档并且更灵活、更好地显示给用户.  相似文献   

6.
基于潜语义标引的自然语言检索   总被引:3,自引:0,他引:3  
在信息检索中, 向量空间模型是最有效的数学工具之一。由于自然语言检索的特殊性, 以及传统信息检索模型受到同义词、多义词的影响, 检索的查准率不高。为了提高自然语言检索的查准率, 我们对基于概念的信息检索模型——
潜语义标引(LS I) 模型进行了探讨, 并分析了基于LS I 的两个实例。  相似文献   

7.
提出一种基于概念格的数字图书馆用户检索行为序列模式挖掘方法。该方法采用“基于概念格的自顶向下与分治相结合”的挖掘思想,通过自顶向下的概念格迭代,利用概念格的复用性和提取频繁项集的优势,获得数字图书馆用户检索行为的序列模式。该方法不需要遍历原始用户信息数据库,能够大大压缩挖掘时间,有助于数字图书馆提高用户检索速度、改进个性化服务。  相似文献   

8.
针对传统信息检索模型不能很好满足用户需求的问题,在分析现有相关研究的基础上,提出基于领域Ontology的知识检索模型。通过构建领域Ontology,对文档进行语义标注,对查询请求进行概念提取和语义扩展,从而得到语义索引项作为文档和用户请求的知识表达,进一步研究领域Ontology中词语间语义关系的计算模型。考虑到语义相似度与语义相关的内在关系,给出相关系数来衡量检索目标与候选者间符合程度。最后对提出的模型进行验证,结果表明检索性能有显著提高。  相似文献   

9.
文章分析维基百科中的文档、目录、超链接、重定向以及消歧义等基本元素与结构关系特点,围绕维基百科在信息检索、文本分类、文本聚类、歧义消解、查询扩展与信息抽取以及本体构建等信息处理任务中的典型解决方法与相关项目,综述和评析基于维基百科的语义知识挖掘的研究与应用方法,从整体上把握基于维基百科的知识挖掘研究现状与进展,为当前知识服务系统建设提供借鉴。  相似文献   

10.
基于时态语义的Web信息检索在动态时间信息挖掘、群体记忆、时间问答系统等检索情景中具有相对广泛的应用。在大数据和人工智能迅猛发展的大趋势下,对基于时态语义的Web信息检索从关键技术的角度进行系统而全面的综述,不仅有利于了解该领域研究的整体状况,而且有益于把握时态检索的未来发展趋势。本文在引入文本时间信息的抽取和标注并融合时间信息的检索模型的基础上,以时态语义的技术为整体脉络,从三个方面综述研究情况:信息需求中隐含的时间意图分析,加入时间因素的检索模型构建,时间对提升检索结果的生成。以时态语义检索的本源问题和其在学术文献上的相关应用为切入点,提出时态语义检索未来的发展趋势:识别多源异构信息下的时间表达,构建能识别查询的时间预测模型,搭建能精准检索时间意图的检索平台和开发基于深度学习的隐含时间意图自动分类模型。参考文献91。  相似文献   

11.
梁柱  沈思  叶文豪  王东波 《情报学报》2022,41(2):167-175
在现有的裁判文书检索系统上,非专业领域的用户检索具有局限性。目前,法律领域的智能检索仅在基于裁判文书的法律条文的推荐和分类上开展了研究,缺乏对裁判文书自动推荐的相关研究,因此,本文提出了一种利用类新闻的事实性文本智能推荐裁判文书的方法,结合目前的研究工作,总结裁判文书的结构和内容特征,利用类新闻的事实性文本模拟非法律专业用户的检索查询式,构建含有结构内容特征的裁判文书语料库,并自动推荐相关裁判文书文档。结果显示,利用裁判文书的法院意见结构内容特征,对新闻语料进行特征词表示之后,LambdaMART模型在文本匹配结果上表现良好,优于传统的全文检索技术。  相似文献   

12.
A searcher’s interaction with a retrieval system consists of actions such as query formulation, search result list interaction and document interaction. The simulation of searcher interaction has recently gained momentum in the analysis and evaluation of interactive information retrieval (IIR). However, a key issue that has not yet been adequately addressed is the validity of such IIR simulations and whether they reliably predict the performance obtained by a searcher across the session. The aim of this paper is to determine the validity of the common interaction model (CIM) typically used for simulating multi-query sessions. We focus on search result interactions, i.e., inspecting snippets, examining documents and deciding when to stop examining the results of a single query, or when to stop the whole session. To this end, we run a series of simulations grounded by real world behavioral data to show how accurate and responsive the model is to various experimental conditions under which the data were produced. We then validate on a second real world data set derived under similar experimental conditions. We seek to predict cumulated gain across the session. We find that the interaction model with a query-level stopping strategy based on consecutive non-relevant snippets leads to the highest prediction accuracy, and lowest deviation from ground truth, around 9 to 15% depending on the experimental conditions. To our knowledge, the present study is the first validation effort of the CIM that shows that the model’s acceptance and use is justified within IIR evaluations. We also identify and discuss ways to further improve the CIM and its behavioral parameters for more accurate simulations.  相似文献   

13.
一种新的搜索引擎探讨   总被引:1,自引:0,他引:1  
罗三定  廖程锋 《情报学报》2004,23(4):428-432
传统的搜索引擎都不具备理解文档内容的能力 ,导致查准率普遍不高。本文提出一种采用RDF和信息提取技术的新的搜索引擎。该引擎采用信息提取技术自动获取和生成网络资源的元数据 ,由RDF描述并携带在互联网上传输、交换 ,智能代理负责收集、处理该元数据信息并向用户提供检索服务。由于计算机可以理解RDF携带的元数据的含义 ,因此可以做到基于内容的概念检索。本文在分析各种技术背景的基础上 ,给出了这种搜索模型的结构图 ,阐述了该系统的原理、优点 ,并给出了部分模块的设计  相似文献   

14.
科技查新是一种重要的文献分析和评价工作,与科技创新密切相关。本文针对目前我国科技查新服务存在 的区域发展不平衡、缺乏统一规范管理、缺乏查新行业合作等问题,根据科技查新工作过程中产生的信息流以及不同 层面的用户,采用了层次结构技术构建了3层架构的科技查新信息资源共享服务模型。分析了质量标准体系、数据挖掘 技术、知识产权问题等实现科技查新信息资源共享的关键技术,以期为科技查新共享工作提供建设思路和发展建议。  相似文献   

15.
[目的/意义]梳理信息查询与检索领域挫折相关的研究现状,为挫折应对提供参考和借鉴。[方法/过程]从挫折内涵、信息查询挫折、信息检索挫折以及相关影响因素等角度分析国内外研究进展,归纳挫折成因。[结果/结论 ]已有文献结合问卷、访谈、实验、日志挖掘等多种研究方法,揭示了挫折产生原因以及用户、任务、信息结果与环境等因素对信息查询与检索挫折的影响。基于这些发现,从挫折理论模型构建、用户挫折感测量、信息素养教育以及信息服务提供等角度提出进一步研究建议。  相似文献   

16.
依据语义检索的特征和文本概念的挖掘,通过楚辞研究数据库的语义实践,提出一种以本体知识库建设为核心,由本体开发、资源管理、检索服务三层架构组成,融语义词典、知识地图、跨库查询和专题搜索为一体的个性化关联语义检索模型,力图使当前的语义检索研究跳出实验的框架,促进相关领域文献知识的组织开发与检索利用。  相似文献   

17.
User queries to the Web tend to have more than one interpretation due to their ambiguity and other characteristics. How to diversify the ranking results to meet users’ various potential information needs has attracted considerable attention recently. This paper is aimed at mining the subtopics of a query either indirectly from the returned results of retrieval systems or directly from the query itself to diversify the search results. For the indirect subtopic mining approach, clustering the retrieval results and summarizing the content of clusters is investigated. In addition, labeling topic categories and concept tags on each returned document is explored. For the direct subtopic mining approach, several external resources, such as Wikipedia, Open Directory Project, search query logs, and the related search services of search engines, are consulted. Furthermore, we propose a diversified retrieval model to rank documents with respect to the mined subtopics for balancing relevance and diversity. Experiments are conducted on the ClueWeb09 dataset with the topics of the TREC09 and TREC10 Web Track diversity tasks. Experimental results show that the proposed subtopic-based diversification algorithm significantly outperforms the state-of-the-art models in the TREC09 and TREC10 Web Track diversity tasks. The best performance our proposed algorithm achieves is α-nDCG@5 0.307, IA-P@5 0.121, and α#-nDCG@5 0.214 on the TREC09, as well as α-nDCG@10 0.421, IA-P@10 0.201, and α#-nDCG@10 0.311 on the TREC10. The results conclude that the subtopic mining technique with the up-to-date users’ search query logs is the most effective way to generate the subtopics of a query, and the proposed subtopic-based diversification algorithm can select the documents covering various subtopics.  相似文献   

18.
基于Web挖掘技术的信息检索系统设计与实现   总被引:2,自引:0,他引:2  
王艳  张帆 《情报学报》2007,26(3):339-343
本文详细介绍一个基于Web文本挖掘技术的信息检索系统的设计与实现。基于Web文本挖掘技术的信息检索技术融合了文本挖掘的思想,它将单一的资源发现或者单一的信息提取的传统的信息检索方法结合起来,从而达到在WWW发现资源并将其中的信息提取出来进行处理的目的。  相似文献   

19.
影响因素分析是在线教育平台用户持续使用行为实证研究中的重要内容,能为相关领域的理论研究和管理实践提供借鉴和建议。文章以CNKI和WOS为数据源,通过关键词检索、追溯检索和数据清洗等步骤获取国内外近5年与研究主题高度相关的代表性文献37篇。整合信息生态理论和实证研究的分析流程形成研究框架,从信息人、信息、信息技术和信息环境等维度探究已有文献所涉及影响因素的研究现状和趋势。研究发现:影响因素研究尚缺乏架构性的系统梳理,基于信息生态理论和实证研究范式对影响因素展开系统研究具有可行性和可靠性。未来,对个体特征更深入的探究、基于教育本质的跨学科多元融合、新兴技术和产业发展前沿、差异性环境等将赋予影响因素研究更为丰富的内容。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号