共查询到19条相似文献,搜索用时 84 毫秒
1.
MEDLINE与CBMDisc数据库的对比分析 总被引:4,自引:0,他引:4
MEDUNE与CBMDisc是目前生物医学领域内使用最为广泛的两个文摘型数据库,它们在检索途径、使用方法等方面基本接近,但在数据处理与检索时也有一些细微的区别。文章在主题词表的构成及更新速度、特征词的处理、字段设置、人名标引及检索等方面对两个数据库作对比分析。 相似文献
2.
3.
基于非相关文献的知识发现原理研究 总被引:10,自引:7,他引:10
从Swanson最早提出非相关文献的知识发现方法开始到现在,很多研究人员都投入到这个新兴的领域中去,概括起来分为以下几种方法:基于单词的词频统计方法、基于短语的词频统计方法、基于概念的知识发现方法、基于概念的词频统计方法,本文详细介绍了这些方法基本原理,并对其进行了简单的比较分析。 相似文献
4.
数据挖掘是一种知识发现,是对已知信息进行的一种再利用技术,大量运用于数据库的增值服务。依托《全国报刊索引数据库》开发新型的多媒体专题数据库,不仅能够受到普通读者的喜爱,而且能够为该主题的学术研究提供准确、全面、有效的重要参考,从而挖掘出原有文献数据库的更大的情报价值。 相似文献
5.
6.
医学文献集合的主题抽取和主题聚类实践 总被引:1,自引:0,他引:1
文献中的重要关键词能够反映其核心主题,因此对文献主题的发现和抽取问题就转化为对文献中的重要关键词集合的抽取.文章在调研了国外在主题抽取和聚类方面采用的技术方法的基础上,提出了在医学学科领域从文本信息资源中抽取主题并进行主题领域判断的技术方案,并详细阐述了其中的主题聚类的技术环节.为了验证该技术方案的有效性,文章以骨关节炎领域为例,对文中提出的技术方案进行实践验证.验证的结果表明文章提出的技术方案有着实际的有效性.该文为2008年第9期本期话题"知识抽取"的文章之一. 相似文献
7.
胡昊天;邓三鸿;孔玲;闫晓慧;杨文霞;王东波;沈思 《情报学报》2024,(5):588-600
情报学术语承载了情报学科基础知识与核心概念。从概念维度梳理与分析情报学术语对推动学科发展、助力下游知识挖掘任务具有重要意义。面对数量快速增长的科技文献,自动术语抽取替代了人工筛选,但现有方法严重依赖大规模标注数据集,难以迁移至低资源场景。本文设计了一种生成式情报学术语抽取方法 (generative term extraction for information science,GTX-IS),将传统基于序列标注的抽取式任务转化为序列到序列的生成式任务。结合小样本学习策略与有监督微调,提升面向特定任务的文本生成能力,能够在低资源有标签数据集场景下较为精准地抽取情报学术语。对于抽取结果,本文进一步开展了情报学领域术语发现及多维知识挖掘。综合运用全文科学计量与信息计量方法,从术语自身、术语间关联、时间信息等维度,对术语的出现频次、生命周期、共现信息等进行统计分析与知识挖掘。采用社会网络分析方法,结合时间维度特征,从术语角度出发,完善期刊的动态简介,探究情报学研究热点、演变历程和未来发展趋势。本文方法在术语抽取实验中的表现超越了全部13种主流生成式和抽取式模型,展现出较强的小样本学习能力,为领域信息抽取提供了新的思路。 相似文献
8.
对于海量司法判决文书而言,使用人工力量从大量文本中准确找到相关的法学知识和案件信息费时费力。因此,有必要从现有的半结构化或非结构化法律文本中提取人们通常关心的信息,并将其存储在数据库中并形成域知识图谱,从而方便用户搜索并快速获得所需信息。同时,鉴于相对固定的格式结构和严格的法律文本规范和抽取工作的成本性要求较为严格,论文采用基于字典和特定规则的策略,并在随机条件场的支持下进行补充,以实现更高的法律知识和案件事实抽取的准确性和有效性。首先,定义了法人实体类型和命名实体,针对该领域的实际需求,定义了11种类型的命名实体。然后,根据针对不同类型的文档和案例得出的判断结构和框架来提取案例知识。最后,使用基于规则的方法提取案件的基本信息,并使用依存语法分析方法从\"已查明事实\"部分中提取事实三元组。 相似文献
9.
文本挖掘、数据挖掘和知识管理
——二十一世纪的智能信息处理 总被引:35,自引:4,他引:35
本文首先介绍了数据挖掘、文本挖掘和知识管理等概念,然后从技术角度出发,将知识管理划分为知识库、知识共享和知识发现三个阶段,分析了作为最高阶段的知识发现的关键技术和意义,最后指出在文本中进行知识发现是新世纪智能信息处理的重要方向。 相似文献
10.
11.
近年来我国数据挖掘研究综述 总被引:27,自引:1,他引:27
数据挖掘是人工智能、机器学习与数据库技术等多学科相结合的产物。作为当前重要的前沿课题之一 ,研究人员提出了许多数据挖掘理论和方法 ,并取得了许多重要的研究成果。本文运用统计、比较方法对相关著作和论文进行了统计研究 ,并对研究中的重点问题及相关成果作了分析总结 相似文献
12.
知识信息谱的分析与提取 总被引:2,自引:1,他引:2
Zipf定理揭示了一篇文献中词出现的频率规律,Luhn在Zipf定律的基础上提出了自动抽取有效词的基本思想。基于Luhn思想的传统信息检索长期停留在文献层次上,难以满足人们通过知识元获取知识的需求。为解决这一问题,本文从概念的内涵和外延的认识论出发,考察人们由模拟事物内涵和模拟事物外延提出的图灵机和Petri网构建两种不同的计算机系统。由此提出了知识信息谱分析概念,试图建立具有语义关系的知识元理论框架,实现一种计算机对知识的理解和处理方法。文中给出了最大熵法提取知识元的方法。试验证明这种方法实用、有效。 相似文献
13.
14.
隐性知识挖掘利用是知识管理的重要环节。阐述了隐性知识的含义以及图书馆员隐性知识的表现形式。提出了图书馆员隐性知识挖掘利用的主要措施。 相似文献
15.
16.
17.
论图书馆隐性知识的挖掘策略 总被引:10,自引:0,他引:10
阐述了图书馆隐性知识的内涵及意义,分析了图书馆隐性知识的类型结构,提出了组织结构、知识管理体系、知识共享机制、报酬激励机制、创新激励机制等图书馆隐性知识挖掘策略,以充分挖掘图书馆的隐性知识。 相似文献
18.
Background: Search filters have been developed in MEDLINE and EMBASE to help overcome the challenges of searching electronic databases for information on adverse effects. However, little evaluation of their effectiveness has been carried out. Objectives: To measure the sensitivity and precision of available adverse effects search filters in MEDLINE and EMBASE. Methods: A case study systematic review of fracture related adverse effects associated with the use of thiazolidinediones was used. Twelve MEDLINE search strategies and three EMBASE search strategies were tested. Results: Nineteen relevant references from MEDLINE and 24 from EMBASE were included in the review. Four search filters in MEDLINE achieved high sensitivity (95 or 100%) with an improved level of precision from searches without any adverse effects filter. High precision in MEDLINE could also be achieved (up to 53%) using search filters that rely on Medical Subject Headings. No search filter in EMBASE achieved high precision (all were under 5%) and the highest sensitivity in EMBASE was 83%. Conclusions: Adverse effects search filters appear to be effective in MEDLINE for achieving either high sensitivity or high precision. Search filters in EMBASE, however, do not appear as effective, particularly in improving precision. 相似文献
19.
论基于TPI系统的矿业工程特色数据库建设 总被引:2,自引:0,他引:2
文章从分析建设矿业工程特色数据库的必要性入手,在概述TPI系统平台软件功能能够满足特色数据库建设要求的基础上,介绍矿业工程数据库建设的现状,并结合笔者建库过程的实践,详细介绍矿业工程特色数据库建设和开发的流程和经验,提出构建特色数据库过程中应注意的问题。 相似文献