首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
在简述副主题词及主题词/副主题组配标引(简称副主题词组配标引)基本内涵基础上,详细分析美国国立医学图书馆医学文本标引工具MTI的副主题词自动组配实现方法:"七巧板"法、基于规则方法和基于统计的方法,试提出中文生物医学文献副主题词自动组配标引研究方向。  相似文献   

2.
CBM数据库的主题词标引质量评价   总被引:1,自引:0,他引:1  
以MEDLINE的主题词标引为金标准,通过查全率、查准率等指标评价CBM主题标引系统中机标的质量。考虑学科的分布,选择10个题目,分别在中国生物医学文献数据库—CBM光盘中和中国生物医学文献系统网络版检索出相关文献。将光盘中的机标文献一一与网络版中即人工审核的文献对比,记录机标的相关文献数,人工审核后相关文献数,机标和人工审核各自独有的文献。通过对计算机自动标引的文献数与人工审核后的文献数比较,得出CBM的计算机自动标引质量在原有的基础上需进一步提高。  相似文献   

3.
目的:比较分析PubMed与Embase收录中国生物医学期刊及其文献标引质量。方法:从重复收录、元数据字段分析PubMed与Embase收录中国生物医学期刊情况,从标引字段、标引深度、标引差异性比较其文献标引质量。结果:PubMed收录的中国生物医学期刊自身元数据描述有29个字段,文献数据标引有47个字段,篇均主题词标引深度为11.12;Embase收录的中国生物医学期刊自身元数据描述有13个字段,文献数据标引有44个字段,篇均主题词标引深度为14.13。结论:PubMed对其收录的中国生物医学期刊自身元数据的描述更详细,Embase对收录的中国生物医学期刊文献主题标引的粒度更细、数量更多、标引更规范。二者对中国生物医学文献的标引较之对外文文献的标引一致性较高。  相似文献   

4.
为更好地促进中国生物医学文献数据库及其他文献数据库的建设和发展,实现标引工作的科学管理,在借鉴美国国立医学图书馆DCMS先进经验的基础上,开发研制了中国生物医学文献联机标引系统。现从系统结构、系统流程和模块功能三方面对该系统进行描述。  相似文献   

5.
中国生物医学文献主题标引系统的研究   总被引:6,自引:3,他引:3  
介绍了基于计算机辅助标引技术的中国生物医学文献主题标引系统的系统工作流程,并分别从辅助词表建立、数据结构设计、算法设计、标引结果审核等方面对该系统进行详细的阐述。  相似文献   

6.
"统一的中国医学语言系统"旨在建立一个计算机化的可持续发展的生物医学检索语言集成系统.该系统由3个部分组成:中国医学用语数据库,中国医学用语语义网络系统,中国医学用语与标引检索语言对应转换系统.该系统的研制在医学文献计算机辅助标引方面发挥着积极作用,在一体化信息检索系统的开发研制方面具有重要作用.  相似文献   

7.
CBMdisc数据库计算机辅助标引技术中值得注意的几个问题   总被引:6,自引:0,他引:6  
计算机辅助标引技术应用于“中国生物医学文献数据库(CBMdisc)”的文献加工过程,对传统的文献加工处理手段而言,是技术上的一大进步。笔者仅就近年来标引工作实践中存在的某些问题谈一下个人体会。  相似文献   

8.
为了提高生物医学文献查引效率,我们采用.NET框架作为系统的开发平台,采用C/S结构模式,在生物医学引文数据库的基础上研制生物医学文献引文集成检索整合平台。该系统实现了统一平台一站式检索,自动去重,自动分组,便捷输出规范的引文报告等个性化功能。  相似文献   

9.
本书对医学文献主题标引的历史、现状以及标引的原则和技术作了论述,同时较全面地介绍了美国MEDLARS标引手册和标引方法,是即将出版的1984年版《医学主题词注释字顺表》的标引注释和说明。书中分别对生物有机体、器官、疾病、药物和诊断、治疗技术等的标引方法作了举例,是我囤生物医学、医学情报、图书工作人员学习标引和检索国内外文献资料的必备工具书,也可作为科研、医疗、教学人员查阅文献资  相似文献   

10.
主题标引作为一种重要的知识组织方法,为知识利用和知识服务奠定重要基础。结合标引工作实践,在简要介绍生物医学文献主题标引的定义、特点、复杂性及质量控制重要性的基础上,重点从标引流程的各个环节探讨如何掌握一定规律,运用一定的方法和技巧,提高标引质量。  相似文献   

11.
生物医学文本挖掘研究热点分析   总被引:3,自引:3,他引:0       下载免费PDF全文
为了解生物医学文本挖掘的研究现状和评估未来的发展方向,以美国国立图书馆 PubMed中收录的 2000年 1月-2015年3月发表的生物医学文本挖掘研究文献记录为样本来源,提取文献记录的主要主题词进行频次统计后截取高频主题词,形成高频主题词-论文矩阵,根据高频主题词在同一篇论文中的共现情况对其进行聚类分析,根据高频主题词聚类分析结果和对应的类标签文献,分析当前生物医学文本挖掘研究的热点。结果显示,当前文本挖掘在生物医学领域应用的主要研究热点为文本挖掘的基本技术研究、文本挖掘在生物信息学领域里的应用、文本挖掘在药物相关事实抽取中的应用3个方面。  相似文献   

12.
生物医学文本挖掘:步骤与工具   总被引:1,自引:0,他引:1       下载免费PDF全文
介绍了生物医学领域里的文本挖掘研究的步骤及各个步骤中所采用的方法,重点介绍了各个步骤中所用的工具和案例,以期促进生物医学文本挖掘研究的开展。  相似文献   

13.
通过梳理国外31个生物医学文本语料库标注内容,根据语料库标注实体类型,参照UMLS语义类型将其划分为6大类。总结语料库在语义类型、数据源等方面特点,阐述生物医学文本语料库构建流程及关键步骤,以期为我国生物医学文本语料库相关研究奠定基础。  相似文献   

14.
目的:探索基于深度学习的文本分类方法在生物医学文本的学科分类中是否具有更好的分类性能。方法:以中国医院科技量值研究中累积的神经病学科、消化病学科、肿瘤学科的SCI论文为数据来源,分别训练并测试CNN、LSTM、LSTM-CNN、LSTM-attention及SVM模型并评估其性能。结果:5类模型中,双层CNN模型的分类性能最好,CNN、LSTM、LSTM-CNN和LSTM-attention模型的分类性能均优于SVM模型。结论:基于深度学习的文本分类方法可提高生物医学文本的学科分类精度,推动医院评价和学科评估的发展。  相似文献   

15.
目前,如何解决海量文本信息与知识增长缓慢的矛盾,以可信的方式发现文本中有用的模式是一项严峻的挑战。本文就国际上有关文本挖掘在生物医学领域的应用进行阐述。概念识别和发现关系研究已经取得丰硕成果,而元数据挖掘正处于起步阶段。利用元数据进行生物医学文本挖掘以及建立知识库是现阶段文本知识发现的重要任务。  相似文献   

16.
对基于文本挖掘的生物医学本体构建进行初步尝试,将文本挖掘结果用本体这一概念模型进行组织和表达,由此证实应用本体存储和表现文本挖掘的结果切实可行,挖掘深度越强,领域本体所表达的知识便会越丰富.  相似文献   

17.
文本挖掘在生物医学领域中的应用及其系统工具   总被引:4,自引:2,他引:2       下载免费PDF全文
系统介绍了生物医学文本挖掘的具体流程和文本挖掘技术在生物医学领域中的应用情况,并着重从自然语言处理和本体、命名实体识别、关系抽取、文本分类与聚类、共现分析、系统工具及评价、可视化等方面分别做了阐述.  相似文献   

18.
针对SinoMed西文生物医学文献数据库功能缺陷,提出基于Mashup理念,整合自有资源与网络资源,拓展西文生物医学文献数据库功能。对系统功能设计和实现进行详细介绍,包括如何调用PubMed、Scopus数据库接口以及NSTL全文传递服务流程等。  相似文献   

19.

Objective

Relation extraction in biomedical text mining systems has largely focused on identifying clause-level relations, but increasing sophistication demands the recognition of relations at discourse level. A first step in identifying discourse relations involves the detection of discourse connectives: words or phrases used in text to express discourse relations. In this study supervised machine-learning approaches were developed and evaluated for automatically identifying discourse connectives in biomedical text.

Materials and Methods

Two supervised machine-learning models (support vector machines and conditional random fields) were explored for identifying discourse connectives in biomedical literature. In-domain supervised machine-learning classifiers were trained on the Biomedical Discourse Relation Bank, an annotated corpus of discourse relations over 24 full-text biomedical articles (∼112 000 word tokens), a subset of the GENIA corpus. Novel domain adaptation techniques were also explored to leverage the larger open-domain Penn Discourse Treebank (∼1 million word tokens). The models were evaluated using the standard evaluation metrics of precision, recall and F1 scores.

Results and Conclusion

Supervised machine-learning approaches can automatically identify discourse connectives in biomedical text, and the novel domain adaptation techniques yielded the best performance: 0.761 F1 score. A demonstration version of the fully implemented classifier BioConn is available at: http://bioconn.askhermes.org.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号