共查询到20条相似文献,搜索用时 93 毫秒
1.
2.
在信息检索中,代数理论是构建检索模型的重要手段之一,以代数理论为基础的检索模型克服了布尔模型不能进行部分匹配的缺点而广为采用。本文分析了代数理论的向量空间模型,并对该模型进行了扩展:用最小项标引词以反映词与词之间的关系,用奇异值分解来捕捉文献的语义结构;最后对这三种模型进行了比较。 相似文献
3.
4.
以矩阵理论作为研究的切入点,将经典向量空间模型中常用的向量和集合以矩阵的形式加以重构,并认为基于向量内积法的相似性计算与相应矩阵的乘法运算等价。结合稀疏矩阵和数据稀疏的定义,分析VSM信息检索背景下数据稀疏产生的原因;同时,讨论三种情形下数据稀疏对相似性计算的共同影响--部分毫无意义的时间复杂度。最后,给出规避数据稀疏问题的三层策略:文本级策略、文本集级策略和矩阵级策略。 相似文献
5.
基于Web挖掘技术的信息检索系统设计与实现 总被引:2,自引:0,他引:2
本文详细介绍一个基于Web文本挖掘技术的信息检索系统的设计与实现。基于Web文本挖掘技术的信息检索技术融合了文本挖掘的思想,它将单一的资源发现或者单一的信息提取的传统的信息检索方法结合起来,从而达到在WWW发现资源并将其中的信息提取出来进行处理的目的。 相似文献
6.
7.
8.
9.
近几年来国外信息检索模型研究进展 总被引:2,自引:0,他引:2
信息检索模型是信息检索的核心.近几年来国外对于布尔模型的研究主要表现在对布尔模型的改进及对扩展布尔模型的进一步优化.对向量空间模型的研究,主要集中在对向量空间模型的扩展研究及对向量空间模型的应用方面.概率模型的发展主要集中在继续对概率模型进一步的研究,其与其它信息检索模型的结合,以及语言模型的研究和发展.近年来对于新兴的基于本体的信息检索模型的研究,主要集中在对基于本体的信息检索模型理论的研究,与其它检索模型的融合,以及基于本体检索模型的应用.国外信息检索模型研究的最新成果,为国内此方面的研究提供了前沿性的参考信息. 相似文献
10.
文本挖掘及其在信息检索中的应用 总被引:3,自引:0,他引:3
文本挖掘是指利用数据挖掘技术,从大量的文本数据中提取感兴趣的、潜在的有 用模式和隐藏的信息。文章详细阐述了文本挖掘系统的组成、过程及相关技术,并介绍了文本 挖掘在信息检索中的应用。 相似文献
11.
浅谈网络环境下的信息检索效率 总被引:5,自引:0,他引:5
网络环境下,信息检索效率主要是指检全率和检准率,它们之间存在互逆、互顺等关系。许多因素影响着检索效率,文章提出了提高检索效率的各种策略,并且展望了其发展趋势。 相似文献
12.
网络信息检索的检全率、检准率影响因素研究 总被引:5,自引:0,他引:5
主要介绍信息检索系统评价的两个常用指标--检全率、检准率,从信息源、搜索引擎检索机制、用户与系统的交互过程3方面分析网络环境下影响它们的因素,并对如何克服不良因素,提高检索质量提出一些建议。 相似文献
13.
相关性研究与情报检索系统评价 总被引:1,自引:0,他引:1
从情报检索系统评价的角度探讨相关性研究发展的历史,分析相关性作为系统性能评价指标的可行性,指出利用相关性评价情报检索系统性能实验的优势及不足,展望相关性研究发展的趋势。 相似文献
14.
从文献检索到信息检索——网络环境下检索课教学内容与方法的调整 总被引:21,自引:0,他引:21
从文献检索到信息检索最大的变化 :一是由文献单元向信息单元为基础的组织方式的改变 ;二是由手工分类、主题标引、著者标引经过机器的主题词、自由词抽取、标引发展到全文标引乃至超文本检索。网络技术、超媒体技术和智能技术等是促其变化的关键。作为一门学科的教学必须创建以CAI课件为主导的实践教学方法和建立信息检索课程的基本框架体系。参考文献 4。 相似文献
15.
16.
网上海量信息引发检索技术变革 总被引:5,自引:1,他引:4
本文从检索目标和技术路线、信息综合排序方法、用于优选信息的评价标准等方面,分析了网上海量信息正在引发检索技术变革的内容,介绍了旨在从网上海量信息中高效率地选取有用信息的检索技术方案用“信息重要性向量”表达信息的综合特征,用“信息筛”高效率地优选信息 相似文献
17.
18.
This paper presents four novel techniques for open-vocabulary spoken document retrieval: a method to detect slots that possibly contain a query feature; a method to estimate occurrence probabilities; a technique that we call collection-wide probability re-estimation and a weighting scheme which takes advantage of the fact that long query features are detected more reliably. These four techniques have been evaluated using the TREC-6 spoken document retrieval test collection to determine the improvements in retrieval effectiveness with respect to a baseline retrieval method. Results show that the retrieval effectiveness can be improved considerably despite the large number of speech recognition errors. 相似文献
19.
文检课为核心的信息素质教育模型的构建 总被引:6,自引:0,他引:6
阐述了韶关学院图书馆文检课的发展历程,特别是教学手段建设和教学方法改革方面取得的成效。随着课程体系的完善,新生教育和讲座的开展,学习网站和传统媒体的揉合,文检课为核心的信息素质教育模型业已凸显。 相似文献
20.
信息检索中的相关性研究 总被引:6,自引:1,他引:6
本文系统地阐述了国外信息检索中的相关性研究 ,具体的论述按照三个阶段展开 ,分别是 195 8年之前的第一阶段 ,195 8— 1976年的第二阶段以及 1976年之后的第三阶段 ;其中每一阶段的阐述又被分为理论与实证两部分 相似文献