首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 470 毫秒
1.
近10年我国传统知识组织系统关联化研究述评   总被引:2,自引:0,他引:2  
韩燕  何琳  彭爱东 《图书情报工作》2017,61(24):135-143
[目的/意义]对传统知识组织系统关联化现状进行梳理和分析,为国内传统知识组织系统语义化研究提供参考和建议。[方法/过程]通过文献数据库及网络平台进行检索和调查,概述国内相关研究情况,并从研究者采用不同语义化描述方法模型的角度对国内传统知识组织系统的语义化描述现状和研究成果进行分析。[结果/结论]对比国外相关研究,指出我国目前的研究运用的语义描述框架对传统KOS的表达能力有限、缺少转换后本体模型的质量控制、关联数据发布成果较少、且鲜有关于后续问题的研究,需要扩展综合现有的语言模型,进行转换后模型的质量控制,同时加强研究成果的开放与共享,逐步实现从理论研究到实践运用的过渡。  相似文献   

2.
[目的/意义]利用关联数据名称唯一性特点,对书目数据进行语义化关联组织,使不同图书馆资源通过文献版本关系发现实现语义聚集。[方法/过程]分析书目关系类型及文献不同版本的特点,提出文献不同版本类型对应的版本关系,然后采用属性值顺序匹配方法,经过同种文献确定、版本关系发现两个步骤发现文献之间的版本关系,并利用美国国会图书馆、德国国家图书馆相关数据以及维基关联数据进行实证研究。[结果/结论]构建基于关联数据、书目数据的文献版本关系发现方法,实现同种文献不同版本的语义关联,发现实证数据间的版本关系,并指出其应用方向。通过该方法可以提供基于关联数据的知识检索服务,满足用户阅读、科研需求。  相似文献   

3.
祝娜  王芳 《图书情报工作》2016,60(5):101-109
[目的/意义]科技创新需要快速发现特定科技领域中关键知识衍生与演化的路径,探索未来的知识创新趋势,为此,有必要对知识演化路径进行动态可视化研究。[方法/过程]从主题关联的角度入手,以3D打印领域为例,基于LDA识别出科技创新主题并进行分阶段细化分析,探测主题集群内部与外部的关联强度,识别出主题不同生命周期的演化能力及其演化类型。[结果/结论]实验结果表明,该方法从主题关联的角度入手,构建了基于时间序列的知识演化路径,丰富了知识管理和信息计量的理论研究方法,在实践上则有助于探测科技创新知识。  相似文献   

4.
[目的/意义] 采用hLDA从专利语料库中抽取层次主题,以描述隐藏在专利文本中的技术结构,并基于层次主题随时间变化情况进行技术演化分析。[方法/过程] 从专利术语中获取闭频繁项集,并基于此建立关联规则网络来度量术语的重要性和术语间语义关系强弱,进而对语料库进行重构,并对不同时间片段的专利集合进行层次主题结构抽取。[结果/结论] 将本方法应用于硬盘驱动器磁头领域的专利数据分析,实证结果表明该方法是一种可行和有效的技术演化分析方法。  相似文献   

5.
[目的/意义]针对目前医学领域基于主题的语义相似度计算研究较少,尚不足以揭示主题间在语义层面的关系,提出一套用于主题间语义相似度计算的方法,进而从语义角度判断主题间关系,为主题新颖性判断、主题关联研究等提供参考。[方法/过程]以MeSH词表为语义计算的基础,剖析词表结构与现有研究成果,从入口词、语义距离、注释3个维度综合测度主题间的语义相似度,利用PubMed中2011-2014年干细胞领域的文献进行实证研究。[结果/结论]利用通用验证主题词对,验证了本文所提3个测度维度的有效性。通过主题间语义相似度的计算,发现干细胞领域2011-2014年较为新颖的主题为未成年人干细胞研究。后续研究中还需融入基于统计的主题相似度,从而更加全面地揭示主题间的关系,发现语义层面领域的新颖性研究主题。  相似文献   

6.
[目的/意义]识别领域发展路径对于科技创新具有重要意义,但现有方法如专家访谈、引文分析等不能适应文献爆发性增长的现状,针对这一问题,提出一种基于主题变迁的领域发展路径识别方法。[方法/过程]该方法可以自动从Aminer平台获取数据,通过构建关键词-学者矩阵,综合使用KMeans++和谱聚类算法识别出研究主题和相关学者;通过相似度计算实现不同主题之间的关联,最终获得研究领域的发展路径并进行可视化展示。[结果/结论]通过对人工智能领域的实证分析,结果表明该方法能够有效反映领域研究主题的变迁,有助于研究者快速定位领域的研究热点和重点,丰富领域发展路径相关的研究方法。  相似文献   

7.
[目的/意义]关联数据的研究对于数据资源的描述、组织、发布、检索、利用等具有重要意义。医学相关领域拥有庞大的数据规模和发达的数据共享实践,对该领域开放关联数据集进行系统的调查研究,对关联数据集的共享、管理、应用而言有重要的参考价值。[方法/过程]从平台分布、主题、格式、链入链出关系、所用词表等维度就医学相关领域的85个开放关联数据集进行调查及统计分析;从药物知识发现、语义关联搜索、智慧医疗建设等方面研究关联数据集的实际应用问题。[结果/结论]归纳医学相关领域开放关联数据集在科学研究和实践应用中的特点,以及在推动语义网发展和支持智慧医疗等方面的欠缺之处,以期促进对语义网、关联数据网络等关联数据发展与应用相关问题的进一步思考、探索和解决。  相似文献   

8.
[目的/意义] 通过对国内外数字文化资源语义融合相关研究成果的总结和Europeana案例分析,为国内数字文化资源整合的研究与实践提供参考和借鉴。[方法/过程] 选取目前发展较为成熟的数字文化资源整合项目Europeana作为案例,分别从资源内容描述规则、语义知识本体模型设计、元数据语义化操作和关联数据的发布与访问4个方面对其数字文化资源语义融合的实现方法进行分析。[结果/结论] 研究发现,构建聚合式元数据模型、建立细粒度语义概念模型、创建开放的语义关联数据网络、提供泛在化关联数据应用服务是实现数字文化资源语义融合的关键。  相似文献   

9.
[目的/意义]针对医学文本的特点,提出一种基于语义图的多文档自动摘要方法,并利用其中的语义信息实现摘要主题的识别。[方法/过程]利用SemRep实现源文档概念及其语义关系的规范化抽取并构建语义图,从概念-关系-社区3个层次对网络图中的关键信息进行抽取并生成摘要,利用概念-语义类型-类型分组三级映射实现对概念的归类,结合语义搭配模式对摘要主题进行划分。[结果/结论]通过对5种疾病数据集进行测试,结果显示该方法能有效识别出文献集中的核心内容,语义图中所富含的语义信息能准确地对摘要进行主题划分。  相似文献   

10.
[目的/意义]非物质文化遗产资源具有重要的社会价值,将主题图技术应用于非物质文化遗产数字资源的整合中,能够更好地实现非物质文化遗产数字资源的传承与保护。[方法/过程]在分析非物质文化遗产数字资源的主题、关联关系和资源标引的基础上,构建非物质文化遗产数字资源主题图并实现其可视化。[结果/结论]研究结果显示,主题图技术的应用可以为非物质文化遗产数字资源提供基于语义的整合,并将主题之间的关联直观地展示给用户,为用户提供可视化导航。  相似文献   

11.
[目的/意义]运用深度学习技术,提出结合时间和空间特征的测度(速度、覆盖度和迂回度)方法,用于量化学者研究主题演化,从而为基于内容的学者评价提供量化依据。[方法/过程]提出三维指标框架,其中速度反映作者改变研究主题快慢的平均程度,覆盖度反映作者研究内容所覆盖的主题广度,迂回度反映作者研究路径的曲折性。使用微软学术数据集中计算机科学的作者进行实证研究,并考察学者研究主题演化的三维测度和学者学术影响力和生产力的关系。[结果/结论] 实证研究结果显示,覆盖度与总被引量和总发文量的关系为单调递减,这一特征说明聚焦于特定研究主题较为深入的作者,其发文量和影响力都较大。作者研究主题演化的"速度"和"迂回度"与总被引量、总发文量都存在先增加后减少的倒U型关系。所提出的多维度指标框架不仅可在理论上丰富科学计量学对于学者研究主题转移演化及其机制的理解,而且结合深度学习模型提出了问题的解决思路。  相似文献   

12.
[目的/意义]主题排序不仅是信息检索、信息组织研究的基础性问题,也是图书馆学科服务的重要工作,对学科领域研究主题进行有效排序能够帮助科研人员和科研管理部门有效把握学科领域的研究态势,准确定位科研方向,快速做出科研决策。[方法/过程]基于趋势分析提出一种学科研究主题优先级排序算法。首先,在主题提取的基础上,根据发文趋势和引文趋势将每个研究主题按研究等级分为贫乏主题、热点主题、冷点主题、过热主题4个子类。然后,分别对各子类下的主题词进行优先级排序。[结果/结论]在情报学领域的实验表明:本文提出的优先级排序算法能够全方位、细粒度、深层次地展示学科领域研究主题的发展等级,该方法可为从时间维度实现动态情报分析提供新的视角。  相似文献   

13.
[目的/意义] 学科主题演化研究有助于掌握学科发展现状、研究热点、研究前沿和发展趋势等情况,是进行科技创新的基础,是面向科技创新的重要研究方向。[方法/过程] 提出一种语义分类的学科主题演化分析方法:将关键词分为研究问题、研究方法和研究技术3类,构建不同语义分类的共词网络;然后基于Fast Unfolding社区发现算法识别具有语义特征的社区(主题);利用相似度算法计算相邻子时期主题间的相似度,构建学科主题演化图谱,以分析某学科领域研究问题、研究方法和研究技术的变化,实现深度、细致的学科主题演化分析。[结果/结论] 通过对2012-2015年CNKI数据库收录的我国大数据研究领域相关论文数据的处理分析,证明该方法的准确性和有效性。  相似文献   

14.
[目的/意义]传统的文献主题提取方法主要是通过关键词、摘要、全文等提取文献的主题内容,使得主题内容不全面或存在"噪音",而从文献内容语义出发,结合引用内容提取文献的主题,能够更加准确地提取出多文档的主题内容。[方法/过程]提出一种面向多文档的基于语义和引用加权的科技文献主题提取算法,利用文献的引用内容和关键词构建Labeled-LDA主题模型,形成文档-主题概率向量,再根据K-means聚类方法聚类文档,提取每类文档集的主题内容。[结果/结论]以PubMed生物医学数据库中的数据作为实验数据,测试该方法的可靠性,结果证明该方法能够准确、全面地提取出多文档的主题内容。  相似文献   

15.
[目的/意义] 针对LDA模型主题识别结果通常包含噪声主题的问题,建立科学有效的主题过滤方法,排除噪声主题,确保主题识别及后续演化分析的准确性。[方法/过程] 基于关键词之间的共现关系,构建关键词关联度指标(KRI),借助定量手段进行主题筛选和过滤。以单细胞研究领域为例,计算各主题-关键词分布的KRI值,与人工判读结果进行对比分析。[结果/结论] 实验结果表明,该方法能够有效排除LDA模型识别结果中的噪声主题,提高主题识别的准确性,也在一定程度上降低了主题识别过程对人工判读的依赖性。  相似文献   

16.
[目的/意义]分析中国国内基于主题模型的科技文献主题发现及演化研究进展,以期为相关研究人员提供参考借鉴及研究思路。[方法/过程]选取中国知网(CNKI)数据库及万方数据知识服务平台作为文献来源,检索并筛选相关文献,通过人工判读提炼出基于主题模型的科技文献主题发现及演化研究的分析流程,并采用文献分析法对流程中国内研究人员所使用到的策略、方法、分析手段等进行归纳和总结。[结果/结论]研究已初具规模,形成较为完整的分析流程,同时各个流程环节上所涉及到的策略、方法和分析手段较为多样化。另外,也存在着一些问题:主题模型方法在科技文献领域的应用尚且不成熟,主题数目固定,缺少对主题模型应用效果的评价方法与准则。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号