首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
当前文本主题获取方法大多依靠单一关联分析,不能全面分析可获取信息,难以准确获取科技发展主题。科技文献的主题词、作者和引文之间蕴含了以研究主题内容为纽带的语义关联关系,主题词共现关系、引文关系和合著关系分别从不同的角度展现了主题关联关系。因此,本文根据主题词之间语义关系距离的远近,将主题识别中主题词关联分为基础关系、强化关系和新增关系,在此基础上提出面向主题识别的多元关系抽取及关系融合方法;并以基因工程疫苗的研发与制备领域为例进行领域实证分析,利用PathSelClus算法实现基于多元关系融合的主题聚类,通过对比实验证明多元关系融合可以有效提高实证领域的文本主题聚类效果,而未来多关系融合主题识别则是需要重点关注的问题。图4。表6。参考文献19。  相似文献   

2.
科技论文关键词呈现多类型、多关联关系的属性,可以借助具有多层次、多超边的超网络进行表示建模。本研究构建了由研究对象-实验品种-研究用途-技术方法 4层关键词子网和多种关联超边组成的超网络模型,并将该超网络模型用于"农业动物生殖细胞和干细胞调控"领域的科技论文的实证分析。该超网络模型在揭示单层关键词子网同质关联关系的同时,也能挖掘多层子网之间的隐性异质关联关系,从而发现了该领域常用技术方法、实验品种、研究对象和研究用途,同时还发现了该领域的技术空白点和技术应用空白点,这些空白点很可能成为未来的研究热点。  相似文献   

3.
[目的/意义] 鉴于"科学-技术关系"是情报学领域的热点研究问题,文献计量方法是研究该问题的常用方法,对国内外研究该问题的主要文献计量方法进行述评,就如何更好地运用这些方法进行"科学-技术关系"研究提出建议。[方法/过程] 在回顾"科学-技术关系"的含义和相关研究方法的基础上,梳理和总结专利的论文引文分析法、论文的专利引文分析法、"专利发明人-论文作者关联关系"分析法3种主要文献计量方法在"科学-技术关系"研究方面的应用和国内外进展,比较3种方法的理论基础、应用范围和存在的问题。[结果/结论] 3种方法基于不同的理论基础,分别被应用于:①识别与科学领域关系较强的技术领域;②识别被科学领域引用较多的技术领域、国家和机构;③测度专利发明人的科学研究活动、大学和企业的合作情况。这些方法分别存在专利的施引动机不明确、专利的论文引文字段不规范、数据较少、主题分析和技术对科学的作用机理研究较少、专利发明人和论文作者名称难以识别和匹配等问题。研究"科学-技术关系"时需根据研究问题和数据特征等选择合适的文献计量方法,并注意解决这些方法存在的问题。  相似文献   

4.
[目的/意义]基于大量专利文献数据的核心技术主题识别有助于识别某技术领域的关键技术、分析关键技术的发展方向,是进行技术创新的基础情报工作,对于研究人员、企业乃至国家层面都具有一定的意义。[方法/过程]提出基于Chunk-LDAvis的核心技术主题识别方法,首先基于经典LDA模型进行主题识别,然后利用名词组块对初始LDA主题识别结果进行标注,构建Chunk-LDA主题识别结果,提高其可解读性;然后基于社会网络分析方法构建主题网络,识别核心技术主题;基于R语言的LDAvis工具包绘制可交互的Chunk-LDAvis核心技术主题关联分析图谱,发现核心技术主题的隐含联系,辅助进行核心技术主题识别。[结果/结论]通过对纳米农业领域进行实证研究,验证了本文提出方法的准确性和可行性。  相似文献   

5.
知识的发展演化一直是图书情报学界重点关注的主题。随着复杂网络理论的复兴,以网络思维探索知识发展过程中结构关系的演化成为学术界的共识。本文以知识间关联关系为基础,对社会化标注模式下Folksonomy知识组织模式中领域知识群落的生长展开研究。基于关联频度提取层次网络,利用k—丛和派系识别知识网络中的松散型与紧密型领域知识群落,从频度、关联、数量、规模、时序多个维度进行交叉复现分析。研究结果表明,领域知识群落的基本生长路径为“关联关系→松散群落→紧密群落”;知识间关联关系的增长是领域知识群落生长过程中数量繁衍和规模扩容的保障;关联关系频度和数量的积累是领域知识群落生长过程中核心凝聚的过滤器。知识群落生长模式与规律的揭示,有助于从知识间的互促互扰关系方面拓展领域知识组织视野并把握知识发展脉络。但本研究在维度的划分粒度方面还有待进一步加强。图3。表4。参考文献36。  相似文献   

6.
领域知识的生长演化问题一直是图书情报学界重点关注的主题。以网络科学思维探索知识生长过程中的关联关系涌现问题,能够对知识关联的生长模式与机制进行揭示。本研究提取知识关联关系累计44万余对,关联频度87万余次,共划分为11个时间窗口。在对时间序列领域知识网络结构属性初步判识的基础上,对关联频度分布进行时间序列分析。并从领域知识生长过程中的关联频度数量、关联频度占比、邻近窗口状态等方面,对知识关联关系及其频度进行跟踪与分析。研究结果表明,知识关联关系生长过程中,关联关系频度的分布符合幂律分布,且在领域知识发展的成熟期表现得更好。知识关联关系的生长过程具有频度层面的“富者更富”的属性,且主要遵循“择优强化”机制。尽管研究所使用的基于社会化标注系统的知识网络尚不足以囊括所有类型的知识网络,但是基于频度演化的知识关联关系涌现模式与机制,有助于促进知识网络、知识生长等领域的研究工作,对于社交网络、传播网络、交通网络等研究不无裨益。图5。表4。参考文献30。  相似文献   

7.
[目的/意义] 明晰由关键词形成的主题内容类关联关系对合著关系预测的影响和作用,形成作者-关键词二分网络上的合著关系预测指标和方法,提高预测准确率和结果可解释性。[方法/过程] 首先,在作者-关键词二分网络上抽取多种路径表示作者间的关联关系,并结合关联强度的计算方式,共同形成多种合著关系预测指标;接着应用逻辑回归的机器学习方法学习不同指标对于合著关系预测的贡献,由此构建二分网络中基于路径组合的合著关系预测指标;最后基于链路预测方法对指标进行评测。[结果/结论] 在图书情报领域的实验证实,作者-关键词二分网络中路径组合指标的准确率最高,较4种单路径指标均有大幅度提高;多种路径均对合著关系预测产生影响,且路径“作者-关键词-作者”(AKA)的作用明显高于路径“作者-关键词-作者-关键词-关键词”(AKAKA);同时,使作者产生关联的关键词能表示作者间的共同研究主题和兴趣,使得结果更易解释。下一步将引入更多路径到该模型中并在其他领域验证方法的通用性。  相似文献   

8.
突破性创新早期识别与弱信号分析综述   总被引:1,自引:0,他引:1  
[目的/意义]通过比较分析不同的突破性创新识别方法,总结现有方法存在的问题,将弱信号引入突破性创新研究的识别中,重点关注突破性创新早期的各类弱信号,尤其是弱关联关系分析,以期实现早期预判。[方法/过程]首先,通过调研现有的识别方法,提炼当前存在的主要问题,指出研究弱信号的必要性。之后,从不同的学科角度介绍弱信号的内涵及表征形式,对其特征进行概括,梳理弱信号的几种识别方法。最后介绍弱关系分析的内涵及应用,提出借鉴多元关系融合算法模型可以实现多种弱关系的有效融合,获取更明确的信息。[结果/结论]突破性创新的识别研究中受关注最多是文献间的引用关系、主题词之间的语义关系等强关系数据,而弱关系蕴含着更多元化的信息,加强弱关系分析可以实现对突破性创新研究的早期预判。未来研究需要寻求有效捕捉弱关联的方法,注重主题的动态演化规律,如利用高阶网络模型分析有效弱信号,提高突破性创新早期识别的准确性。  相似文献   

9.
[目的/意义]为全面、客观、高效、直观地掌握科技领域主题的发展规律和演变趋势,提出一种基于多源数据的领域主题演化路径识别和分析框架。[方法/过程]获取不同来源的科技文献数据,利用多维样本有序聚类方法辅助时间切片,基于改进的词袋构建方法,提升LDA模型主题识别效果,借助Louvain社区发现算法在主题层进行多源数据的融合,分析领域主题演化路径。[结果/结论]利用美国太赫兹研究领域基金项目、论文和专利3种来源的数据进行实证研究,结果表明,3种数据源能够清晰划分出4个时间窗口,改进的词袋构建方法能够表征更准确的领域信息内涵,主题社区有助于从多源数据复杂的演化网络中厘清主题演化脉络。  相似文献   

10.
基于社会网络分析方法构建科学数据开放共享领域作者合著网络,并对合著网络的密度、中心性、结构洞和成分指标进行测度分析;在研究核心作者团体的基础上,对该团体的合著网络和研究主题进行分析,揭示出核心作者团体合著网络特点,并挖掘领域内研究主题,以期推动科学数据开放共享研究领域的发展。  相似文献   

11.
[目的/意义]为了更好地揭示主题研究领域跨学科发展的学科对象和研究内容,提出一种综合的跨学科态势分析方法。[方法/过程]首先,根据主题领域确定涉及到的所有学科类别,并定义学科影响力指数,构建学科影响力网络。然后,对学科影响力网络进行中心度、结构洞和可视化分析,识别核心学科类别。最后,构建关键词-学科类别共现网络,使用网络中心度分析获得由关键词表示的主题内容,并结合核心学科类别和领域专家意见获得跨学科主题内容。[结果/结论]实证表明提出的分析方法能够在一定程度上揭示主题研究领域跨学科发展态势,其有效性得到一定程度的验证。  相似文献   

12.
基于被引次数的引文分析无法直接揭示论文的研究内容,利用关键词或从标题、摘要和全文中抽取的主题词很难客观反映论文的被引原因。本文以碳纳米管纤维研究领域的高被引论文为研究对象进行引文内容抽取和主题识别,经人工判读验证:基于引文内容分析的高被引论文识别的核心主题能够较好地揭示高被引论文的被引原因(引用动机),而且与论文的研究内容相符合;与基于全文、基于标题和摘要的主题识别相比,在引文内容分析基础上识别的主题具有更好的主题代表性,能够有效揭示被引文献的研究内容,是对原文相关信息的重要补充。本文的实验表明基于引文内容分析的高被引论文主题识别是可行而且有效的。图4。表4。参考文献31。  相似文献   

13.
随着社会化媒体的发展,识别海量高质量的用户生成内容在电子商务等领域具有很多的实际意义。本文将主题模型应用到高质量用户生成内容的识别,从语义层面挖掘高质量用户生成内容所具有的特征。本文首先通过对社交平台用户评论特征的分析,构建了基于LDA的用户生成内容主题模型,对主题模型计算结果,采用TFIDF识别高概率主题词的权重,探讨高质量用户生成内容的主题分布特征。最后通过亚马逊网上书店的网络用户评论进行试验,分析了高质量用户评论的主题分布特征。  相似文献   

14.
宋凯  陈悦 《情报学报》2024,(1):25-33
揭示技术演化脉络是把握技术发展规律的前提,基于专利信息的主题挖掘是基于技术发展微观机制呈现宏观规律的重要研究内容,对技术超前布局和创新驱动实践具有重大意义。技术主题动态演化分析DPL-BMM (Dirichlet process biterm-based mixture model with labelling)是一种附有标签的基于双项狄利克雷过程的混合模型,其突破了传统主题模型在进行主题识别时需固定主题数目的局限,通过增加技术主题表示模块使识别到的技术主题内容更加明确。本文以人工智能领域技术为例进行实证分析,研究结果表明,该方法对技术主题及其演化脉络展示具有实际应用价值。  相似文献   

15.
通过利用基于Z-Score标准化的词频统计分析法,从研究主题、关键技术和学科特点对国内外信息检索领域研究的热点进行分析,可以看出国内外基于网络环境的研究成为重要主题;研究的关键技术大体相同,但侧重点不同;国外的研究集中在计算机领域,国内集中在图书情报领域.而未来信息检索中,网络信息检索将得到进一步的发展,知识、多媒体等将成为信息检索的关键主题,新信息检索技术将会成为日后关注的重点.  相似文献   

16.
[目的/意义] 针对LDA模型主题识别结果通常包含噪声主题的问题,建立科学有效的主题过滤方法,排除噪声主题,确保主题识别及后续演化分析的准确性。[方法/过程] 基于关键词之间的共现关系,构建关键词关联度指标(KRI),借助定量手段进行主题筛选和过滤。以单细胞研究领域为例,计算各主题-关键词分布的KRI值,与人工判读结果进行对比分析。[结果/结论] 实验结果表明,该方法能够有效排除LDA模型识别结果中的噪声主题,提高主题识别的准确性,也在一定程度上降低了主题识别过程对人工判读的依赖性。  相似文献   

17.
[目的/意义] 判别重点研究方向对科研管理和科技政策的制定有着重要参考价值,已有的定量方法多是根据创新性、新颖性以及增长性等特征属性设计指标进行识别、推荐,本研究进一步利用研究方向间的关联关系,从网络拓扑结构和特征属性两个维度判别重点研究方向。[方法/过程] 在构建领域文献引用网络的基础上,利用大规模网络聚类算法识别研究方向,并构建研究方向关联网络,利用网络重要节点识别算法从网络拓扑结构的角度判别重点研究方向,同时结合新颖性、增长性和H指数三个特征属性指标,构建了重点研究方向遴选指标体系。[结果/结论] 对纳米科技领域进行实证分析,经专家判读,认为加权PageRank、Gefura以及增长性指标更加具有客观性、全面性和稳定性,通过综合运用三个指标遴选出208个纳米科技领域的重点研究方向。  相似文献   

18.
刘俊婉  庞博  徐硕 《情报学报》2023,(12):1395-1411
基于专利的弱信号探测模型与技术颠覆性潜力测度体系相结合的方法,开展颠覆性技术早期识别,为颠覆性技术的早期识别提供一套有效的方法和思路。利用专利信息进行领域弱信号探测,利用LDA (latent Dirichlet allocation)主题模型从领域专利内容中抽取主题,基于弱函数对主题进行过滤得到包含弱信号的主题集合,进一步通过预兆函数对弱信号主题包含的术语进行过滤,得到该研究领域弱信号术语集合及其对应的专利集合。基于技术颠覆性潜力测度指标体系,对包含弱信号术语的专利进行颠覆性潜力测度,最终得到目标领域具有颠覆性潜力的技术,为该领域颠覆性技术的早期识别提供参考。以incoPat专利数据库中2008—2019年基因编辑领域的专利数据作为研究对象,结合弱信号探测模型与技术颠覆性潜力测度体系,对该领域具有颠覆性潜力的技术进行早期识别,通过与基于关键词识别的弱信号结果对比,并利用CRISPR/Cas9技术对上述颠覆性技术识别结果进行验证,证明了本文方法的可行性和有效性。  相似文献   

19.
[目的/意义] 学科主题演化研究有助于掌握学科发展现状、研究热点、研究前沿和发展趋势等情况,是进行科技创新的基础,是面向科技创新的重要研究方向。[方法/过程] 提出一种语义分类的学科主题演化分析方法:将关键词分为研究问题、研究方法和研究技术3类,构建不同语义分类的共词网络;然后基于Fast Unfolding社区发现算法识别具有语义特征的社区(主题);利用相似度算法计算相邻子时期主题间的相似度,构建学科主题演化图谱,以分析某学科领域研究问题、研究方法和研究技术的变化,实现深度、细致的学科主题演化分析。[结果/结论] 通过对2012-2015年CNKI数据库收录的我国大数据研究领域相关论文数据的处理分析,证明该方法的准确性和有效性。  相似文献   

20.
[目的 /意义]提出一种潜在学科交叉主题识别方法,主要开展学科交叉主题识别与知识融合测度两方面的研究,以识别处于知识融合潜伏期和萌芽期的潜在学科交叉主题。[方法 /过程]首先,设计并提出学科关联实体抽取规则,构建基于学科关联实体的学科交叉潜力计算方法,以实现学科交叉主题识别,解决潜在交叉点识别的问题;其次,构建以融合强度、融合广度、融合深度为中心的学科交叉主题知识融合阶段特征测度指标与方法,以揭示知识融合过程;最后,基于交叉主题知识融合阶段特征与判断规则,识别处于潜伏期与萌芽期的潜在学科交叉主题。[结果 /结论 ]以合成生物学和水稻遗传改良领域为例,开展潜在学科交叉主题识别研究,以验证方法的可行性。结果表明,提出的方法能够识别学科领域之间的潜在交叉主题,为高效探测有潜力的学科交叉研究领域,发掘未来的研究发展动向和机会提供可能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号