首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 171 毫秒
1.
基于词向量扩展的学术资源语义检索技术   总被引:1,自引:0,他引:1  
[目的/意义] 尝试以统计的方法为指导思想,探究基于词向量扩展的语义检索技术来提升学术资源的语义检索能力。[方法/过程] 利用自然语言处理、文本挖掘技术,对采集来的学术资源(主要是学术论文)元数据进行预处理,结合word2vec词向量生成工具和elasticsearch全文检索引擎搭建语义检索系统,对学术资源进行语义检索的探索研究。[结果/结论] 本文提出的方法能够有效提升学术信息的检索效果,一定程度上实现学术资源的语义检索,并为后续语义检索的进一步研究提供借鉴。  相似文献   

2.
[目的/意义]为更好地提升科技文献的语义丰富化效果,对国内外科技文献语篇元素标注模型、技术和方法进行调研总结,为文本挖掘、科技论文知识抽取、语义分析系统研究者提供借鉴。[方法/过程]利用学术网站搜索和相关数据库搜索引擎,对涉及科技论文标注、语篇元素、知识抽取、句子识别和自动文章分类等参考文献以及研究报告进行深入阅读和调研,对语篇元素自动标注模型以及相关工作进展进行研究总结。[结果/结论]科技文献语篇元素标注具有非常重要的实际应用价值,构建标注模型需充分考虑构建思想、标注领域和标注粒度以及标注技术手段等方面。  相似文献   

3.
[目的/意义] 对国内外SKOS模型及其应用研究成果现状进行梳理及分析,旨在为国内应用SKOS模型展开服务提供参考与启发。[方法/过程] 通过中外数据库检索和网络调查,对有关SKOS模型及应用的文献按年代进行统计分析,从知识组织系统SKOS描述方法、SKOS模型的局限与扩展、SKOS词表管理与质量控制、SKOS模型的应用4个方面分别进行评价和总结。[结果/结论] 分析得出国外SKOS研究的特点是跨学科、跨语言和注重实践。我国应该加强SKOS研究成果的共享,拓展研究广度,增加研究深度,从而加速知识组织系统语义化应用的进程。  相似文献   

4.
[目的/意义] 在语义出版发展的背景下,针对目前学术期刊数字资源聚合中存在的问题,提出实现面向语义出版的学术期刊数字资源聚合的方法,以期解决学术期刊数字资源提供与科研用户信息需求间的矛盾。[方法/过程] 探讨面向语义出版的学术期刊数字资源聚合模型,构建以"冠心病"为具体应用背景的资源聚合实例,验证面向语义出版的数字资源聚合方法在学术期刊数字出版中的可行性。[结果/结论] 以语义出版为导向进行学术期刊数字资源深度聚合,可以实现数字资源知识单元之间及与外部知识组织的语义关联,为科研用户提供更加高效的信息资源服务。  相似文献   

5.
[目的/意义]技术创新服务平台的建设中需要智能搜索引擎技术,智能搜索引擎技术的内涵或者说重点在于自动语义标注.技术创新服务平台上对搜索引擎的要求,与大众的搜索引擎的需求还是不同的,处理的对象主要是专业领域的文本,通过语义标注技术,能快速对企业文档进行语义化和结构化组织,从而为企业提供精准的知识服务.[方法/过程]针对专业领域语义标注的相关问题,在进行深入研究与探讨的基础上,将语义标注理解为是对一组文档资源进行组织语义化的过程,提出利用结构化语义概念资源或集合对数字化文本进行自动标引的方法,并根据概念实体出现频次、位置和关系等因素,自动抽取相关语义概念集合,实现相关文本的语义内容的自动标注.[结果/结论]评价语义标注相关实验的效果,展示语义标注的具体应用场景.同时,体现领域本体与语义标注语料不断更新、进化、形成互动的过程,旨在为专业领域的语义自动标注及智能搜索引擎的构建提供有益的参考.  相似文献   

6.
中文叙词表的语义化转换   总被引:1,自引:0,他引:1  
欧石燕 《图书情报工作》2015,59(16):110-118
[目的/意义]随着语义网与关联数据的兴起与发展,采用SKOS语言对叙词表进行语义化描述成为主流,这为叙词表在网络上的发布、共享以及在网络环境下的应用提供新的契机。[方法/过程]以《汉语主题词表》为例,对中文叙词表的语义化表示、验证和关联数据发布进行探索。首先,制定基于SKOS、SKOS-XL和SKOS扩展的叙词表语义化表示方案, 实现对叙词表的无损语义描述, 开发基于N-Triples格式的词表语义化转换程序, 使大规模词表的语义化转换更加简单高效;其次,采用新兴的SPIN框架对语义化词表的完整性进行验证, 为SKOS词表的正确性与合法性提供保证;最后,采用“Jena TDB+Fuseki+Pubby”的组合将SKOS/RDF词表数据在网络上发布为关联数据,并开发词表关联数据检索界面。[结果/结论]实验结果表明,采用本文的方法能够实现整个《汉语主题词表》的高效语义化转换、验证与发布,促进中文叙词表在网络上的共享与应用。  相似文献   

7.
基于知识元的科技文本内容描述框架研究   总被引:1,自引:0,他引:1  
[目的/意义] 从细粒度角度深化科技文本的内容语义描述,弥补目前文本知识对象特征描述粒度较粗且缺乏语义的不足,为知识重组与挖掘,提供精细化的用户知识服务给予一种思路。[方法/过程] 以知识元理论为基础,通过对科技文本内部属性的语义分析,尝试构建细粒度的科技文本内容描述框架,给出两个实例并讨论。[结果/结论] 该内容描述框架实现了检索结果从海量的文献单元聚焦到精准化的知识元的转变。  相似文献   

8.
[目的/意义]为ISO术语国际标准实现语义Web化服务提供可行的方案和系统验证。[方法/过程]针对ISO 5127(Information and Documentation-Foundation and Vocabulary)的整体信息和第3部分的术语款目结构特征,提出了相应的SKOS语义描述方案。利用计算机程序自动判断其Word格式或HTML格式文本中每一个术语的唯一代码、首选标签、替代标签、定义、来源、示例等,将所有术语款目转换为相应的SKOS文件,并采用分类法共享服务系统CLSS的解决方案,实现了ISO 5127的共享服务系统ISO 5127_CLSS,包含Web版、Linked Data服务和Web Service服务功能。[结果/结论]采用Dublin Core和SKOS对ISO 5127术语国际标准进行语义描述,并采用CNKOS的支持系统CLSS解决方案快速实现其广泛共享服务是切实可行的。其他分类法类型的知识组织系统(如分类法、范畴表、规范代码表等)均可依此方法快速完成语义描述方案的设计和共享系统的实现。  相似文献   

9.
[目的/意义]针对社会化标注系统用于数字档案资源组织后带来的资源检索与导航问题,提出依托主题图的数字档案资源聚合模型,以期提高数字档案资源检索效率并建立有序的可视化导航。[方法/过程]在剖析利用主题图实现社会化标注系统资源聚合相关研究现状的基础上,构建数字档案领域基于主题图的资源聚合模型,给出利用社会网络分析和形式概念分析析取数字档案资源主题图的主题类型、关联关系及资源指引三要素的体系化解决方案,从而实现数字档案标注系统资源聚合。[结果/结论]以NARA数字档案标注系统中的"Women at War"话题为例,利用所提方法并结合Ontopia工具实现目标话题的数字档案资源聚合,有效提高系统中数字档案资源的检索效率和导航效果。  相似文献   

10.
[目的/意义] 为解决现有网页文本缺乏起源标注的问题,提出一种借助PROV本体发现相似网页文本起源关系的方法。[方法/过程] 通过聚类算法、自动语义标注和关联数据构建等技术的综合应用,结合PROV-POL溯源模型,检测网页文本实体的演变过程,实现文本级和属性级两级溯源方案。[结果/结论] 实验验证了借助语义网技术和数据溯源模型实现网页文本数据溯源的可行性,但实验过程中聚类算法的召回率有待提高。  相似文献   

11.
[目的/意义]从学术期刊中抽取其中的理论是对文献进行内容分析的前提,实现理论名称识别的自动化可以提高内容分析的效率。[方法/过程]将理论识别视为一类命名实体识别问题,总结现有的命名实体识别的常用方法,提出一个基于语义泛化思想的命名实体识别方法,选取词性、知网义原等外部知识,采用CRF模型对《情报学报》1822篇论文的标题和摘要进行实验。[结果/结论]实验表明,识别准确率最高达到95.38%,但召回率较低;训练语料规模对性能影响较大,不同程度的语义泛化方法对准确率和召回率有复杂影响。如何选择语义特征、语义标注和语义消歧是需要解决的新问题。  相似文献   

12.
[目的/意义]传统的关键词自动抽取将摘要看成一个整体,常以候选词的出现频次等非语义信息构建特征,并未考虑学术文献摘要中目的、方法、结论等各个结构功能语义蕴含的差异性。本文以中文文献为研究对象,探讨候选词所在的结构功能域对关键词抽取的影响和作用。[方法/过程]本文将文献标题和摘要文本共分为4个结构功能域,在传统的词频、词长、词跨度等基准特征上,融合了基于BERT的语义特征和结构功能特征,并以不同的特征组合方式,使用图书情报领域的中文学术文献,基于分类模型进行关键词自动抽取实验。[结果/结论]实验结果表明,融合结构功能特征后,关键词抽取效果整体提升了6.82%,证明了学术文献摘要结构功能的识别形成的结构功能特征对关键词抽取效果的提升有良好作用。  相似文献   

13.
赵华茗  钱力  余丽 《图书情报工作》2020,64(11):108-115
[目的/意义] 探索科研命名实体及其关系的识别与抽取,提升其在长句等复杂情况下的识别效果,为进一步的应用提供参考与借鉴。[方法/过程] 以依存句法特征分析为基础,提出一种科研命名实体关系抽取方法,过程包括:①使用Standford Tagger工具对目标文本进行词性标注;②基于标注结果,围绕核心谓词和SAO结构,将目标文本分割为结构规范的语义片段;③通过依存句法分析,找出与核心谓词语义相关的主语和宾语,构成(实体,关系,实体)三元组。[结果/结论] 与Ollie、Reverb等主流算法进行的对比测试表明,该方法可以有效提升科研命名实体识别的准确性。  相似文献   

14.
[目的/意义] 快速、准确地从突发网络舆情文本中识别事件。[方法/过程] 提出一种融合句法特征和句法相似度的网络舆情突发事件识别方法。结合句法特征提出面向事件的句法特征提取方法,利用事件语义标注和句法特征提取方法构造事件句法特征库,通过计算待测文本与句法库的句法相似度来识别网络舆情突发事件。[结果/结论] 以新型冠状病毒肺炎疫情为例,所提出网络舆情突发事件识别方法在该舆情下的最优相似度为0.93,在此相似度下从一段新的文本中识别出160个事件和30个非事件,F1值达到了0.848。通过方法测评证明网络舆情突发事件识别方法在利用句法相似度识别事件和进行相同相邻词性合并等方面创新的有效性。  相似文献   

15.
[目的/意义]针对当前我国高校机构知识库研究与应用离真正的开放互连、知识集成、知识检索还有较大差距的问题,提出一种面向关联数据的机构知识库构建方法,该方法覆盖机构知识库构建的整个过程,并支持机构知识的资源整合、语义检索、知识推理和关联数据发布,为各高校机构知识库建设提供参考。[方法/过程]调研和剖析国内外典型的机构知识库,将机构知识库构建方法分为5个步骤,包括:①评价和选择有价值的信息资源;②建立机构知识库概念模型;③进行语义描述和关联设置;④发现并创建关联化数据环境下的语义推理规则;⑤设计系统架构,并通过西南科技大学机构知识库构建实例来验证该方法的有效性。[结果/结论]实例验证表明,面向关联数据的机构知识库构建方法具有合理性和有效性,起到了降低机构知识库开发难度和缩短开发周期的作用,对于其他机构知识库的建设具有参考价值。  相似文献   

16.
张晗  赵玉虹 《图书情报工作》2016,60(11):135-142
[目的/意义]针对共词分析存在的普遍问题,提出一种基于细粒度语义分析的共词网络构建与分析方法。[方法/过程]借助SemRep实现源文本主题概念及其语义关系的规范化抽取并由此构建语义共词网络,然后以节点的中心度和边的频次为指标对内容特征词进行抽取,利用UMLS语义网络规定的语义搭配模式,通过概念-语义类型-语义类型组的两级映射,对语义述谓项进行类团划分。[结果/结论]通过与常规共词分析方法比较,发现基于细粒度语义关系的共词分析能有效地揭示文本主题内容,利用UMLS语义网络资源能从语义学角度清晰准确地对语义共词网络进行类团划分。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号