首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 265 毫秒
1.
[目的/意义] 采用hLDA从专利语料库中抽取层次主题,以描述隐藏在专利文本中的技术结构,并基于层次主题随时间变化情况进行技术演化分析。[方法/过程] 从专利术语中获取闭频繁项集,并基于此建立关联规则网络来度量术语的重要性和术语间语义关系强弱,进而对语料库进行重构,并对不同时间片段的专利集合进行层次主题结构抽取。[结果/结论] 将本方法应用于硬盘驱动器磁头领域的专利数据分析,实证结果表明该方法是一种可行和有效的技术演化分析方法。  相似文献   

2.
王平 《图书情报工作》2014,58(22):70-77
自动挖掘科技文献主题并识别主题变化对于科研工作者及时获取相关领域的最新研究动态有着重要作用.针对科技文献主题多样、动态性强等特点,分析科技文献主题发现及演化具体方法,基于层次概率主题模型hLDA,采用Gibbs抽样来进行模型参数估计,并运用互信息的方法对主题词进行筛选,以提取高质量的主题词.最后,利用先/后离散分析方法研究主题随时间的演化问题.实验结果验证了主题发现及演化方法的可行性及有效性.  相似文献   

3.
[目的/意义]传统的文献主题提取方法主要是通过关键词、摘要、全文等提取文献的主题内容,使得主题内容不全面或存在"噪音",而从文献内容语义出发,结合引用内容提取文献的主题,能够更加准确地提取出多文档的主题内容。[方法/过程]提出一种面向多文档的基于语义和引用加权的科技文献主题提取算法,利用文献的引用内容和关键词构建Labeled-LDA主题模型,形成文档-主题概率向量,再根据K-means聚类方法聚类文档,提取每类文档集的主题内容。[结果/结论]以PubMed生物医学数据库中的数据作为实验数据,测试该方法的可靠性,结果证明该方法能够准确、全面地提取出多文档的主题内容。  相似文献   

4.
胡潜  石宇 《图书情报工作》2016,60(8):106-112
[目的/意义] 更全面地理解用户标签使用行为的影响因素,为标签推荐和应用实践提供指导。[方法/过程] 采用日志分析法,从人均标签个数、标签类型分布两个方面分析图书主题的影响,并以计算机、心理学、经济学、文学作品、绘画5类图书为例,基于社会化标注社区豆瓣网的用户数据进行实证分析。[结果/结论] 图书主题会对用户的标签个数及类型分布具有显著影响:①在标签个数方面,计算机、心理学、经济学、文学作品主题图书的人均标签个数相近,显著高于绘画主题图书;②在标签类型分布上,根据5类图书间的差异可分为3组:计算机、心理学和经济学、文学作品和绘画。这一结论对图书标签推荐及图书分面检索和导航系统的设计具有参考作用。  相似文献   

5.
[目的/意义]以主题短语识别为研究对象,提出基于PhraseLDA模型的主题短语挖掘方法,为快速理解文本内容、准确抽取文本主题提供借鉴思路。[方法/过程]对低频词进行量化定义,提出一种合理的短语重要度计算方法,最终利用PhraseLDA主题模型推理出主题短语。[结果/结论]实验结果表明该方法在多种数据集中挖掘出的主题短语质量较高,主题一致性较强。  相似文献   

6.
[目的/意义] 推荐结果覆盖用户的不同兴趣领域,良好的主题多样性对于提高图书馆个性化阅读推荐服务的用户满意度具有重要意义。[方法/过程] 提出一种基于社交网络分析的阅读推荐方法,通过用户的兴趣相似好友,挖掘用户的多样隐性兴趣,为用户提供主题多样性的阅读推荐,并给出具有良好学科主题多样性的高校图书馆图书推荐案例。[结果/结论] 用户社交网络分析可为高校图书馆发现用户的多样兴趣,进而提供主题多样性的阅读推荐服务,构建用户多元知识结构提供新途径。  相似文献   

7.
基于主题模型的科技报告文档聚类方法研究   总被引:1,自引:0,他引:1  
[目的/意义]探索实践以科技报告为文献载体形式的融合主题模型的文本聚类方法,拓展基于科技文献进行技术监测服务的新领域,提出基于科技报告进行语义分析的新方法。[方法/过程]以国家科技报告服务系统中的科技报告为数据源,首先基于LDA主题模型对经过文本预处理的科技报告进行主题挖掘,再基于Ward与K-means相结合的聚类算法对包含主题分布信息的文本向量进行聚类分析,尝试提出一种适合科技报告文档聚类的文本挖掘新方法。[结果/结论]实验结果表明,LDA主题模型能有效准确挖掘科技报告中的主题信息,所提出的Ward与K-means相结合的聚类算法对科技报告的聚类效果也优于其它传统聚类算法。  相似文献   

8.
[目的/意义] 为了解决研究生用户面临的检索问题,提出一种基于LDA和社会网络中心度分析的个性化检索推荐模型。[方法/过程] 首先,该模型以研究生学科专业为个性化特征,并据此选择相应的数据源。其次,该模型使用LDA识别主题内容,以完成全面知识的展示。再次,该模型根据用户提交的检索词在相应的关键词-主题共现网络中进行社会网络中心度分析,以完成用户相关知识的推荐。[结果/结论] 实验表明,该模型能够很好地解决研究生检索中个性化特征、全面知识展示以及相关知识推荐三大问题,其有效性得到一定程度的验证。  相似文献   

9.
[目的/意义]针对医学文本的特点,提出一种基于语义图的多文档自动摘要方法,并利用其中的语义信息实现摘要主题的识别。[方法/过程]利用SemRep实现源文档概念及其语义关系的规范化抽取并构建语义图,从概念-关系-社区3个层次对网络图中的关键信息进行抽取并生成摘要,利用概念-语义类型-类型分组三级映射实现对概念的归类,结合语义搭配模式对摘要主题进行划分。[结果/结论]通过对5种疾病数据集进行测试,结果显示该方法能有效识别出文献集中的核心内容,语义图中所富含的语义信息能准确地对摘要进行主题划分。  相似文献   

10.
[目的/意义]随着信息资源在数量和种类上的急剧增长,学科间的交叉融合不断涌现,快速主动地从海量信息资源中识别和判断研究主题的发展演化是实现科技创新的基础。[方法/过程]在相关理论调研的基础上,结合医学领域的资源特点,提出一种基于LDA模型的主题演化探测模型和相应的流程步骤。主要步骤包括医学主题词抽取、主题识别、主题关联、关键主题识别、关键主题的演化主路径识别、演化主路径上主题分裂、融合事件识别,实现深度、细致的主题演化分析。[结果/结论]选用乳腺癌治疗研究文献为实验案例,对判断模型进行试验并对结果进行分析验证,证实提出的技术方法具有一定的可靠性。  相似文献   

11.
[目的/意义]提出一种新的层次化科学知识结构发现方法,为优化知识结构发现过程,改善知识组织形式提供借鉴。[方法/过程]利用LDA主题模型构建层次化的科学知识结构发现方法,依据主题间平均相似性自动确定知识结构层数,通过在"文档-主题"概率矩阵中自动筛选阈值截取各主题文献子集,最后采用树形图展示科学领域的知识结构,发掘知识间的关联性和继承性,并与层次主题模型HLDA方法进行比较。[结果/结论]通过实证研究与对比,证明本文提出的方法得到的知识结构更优,知识主题表征性更强且运行效率更高,并在单层主题区分度和层间主题继承性方面较HLDA方法有较大提升。  相似文献   

12.
余菜花 《图书情报工作》2015,59(19):145-148
[目的/意义] 对《网络环境中公共图书馆和高校图书馆用户需求实证研究》一书中以图书馆用户需求作为切入点和研究基点分析网络环境中公共图书馆和高校图书馆的用户需求这一特色之处进行评析,以期为读者选择和阅读该书提供一定的参考。[方法/过程] 仔细研读该书,并将其与现有同类研究成果进行比较,在归纳概括的基础上,明确该书的特色。[结果/结论] 该书具有5大特点,即选题新颖,研究过程科学缜密;调查资料来源广泛,实证研究贯穿始终;案例较丰富,分析深入具体;创新性地提出图书馆用户需求模型和满意模型;研究成果具有较强的学术价值和指导作用。  相似文献   

13.
毕强 《图书情报工作》2017,61(19):146-149
[目的/意义]对苏新宁等著的《面向知识服务的知识组织理论与方法》一书的学术特色及其应用价值进行评价,以期促进面向知识服务的知识组织研究进展。[方法/过程]运用客观评价方法,从面向知识服务的知识组织体系建构和知识组织方法与工具的发展两个方面对该书做出客观评价。[结果/结论]该书所取得的创新性研究成果对于构建完善的知识组织学科体系,促进信息服务向知识服务延伸具有重要的理论与实践意义。  相似文献   

14.
白华 《图书情报工作》2015,59(17):127-133
[目的/意义]针对大众分类法和知识组织系统各自的优势和缺点,构建兼有大众分类和概念本体特征的新本体,利用语义关联技术为标签添加语义,以克服传统分类线性结构的缺陷。[方法/过程]建立一个"文学图书本体", 该本体以每对概念与标签之间的资源相似率为标准,采用标签—概念映射和集成技术把标签映射到概念框架中,从而一方面赋予标签以等级关系、同一关系和相关关系等语义,另一方面提高概念本体的标引能力,使每种图书的属性充分得到语义表达和揭示。[结果/结论]试验表明,新本体在容纳性、灵活性和多向语义关联方面的功能,均有显著提高,因而可提高图书资源的知识表示和组织能力。  相似文献   

15.
[目的/意义] 针对现有弱信号全自动识别研究尚不完善的问题,提出基于LDA-BERT融合模型的弱信号全自动识别方法。[方法/过程] 基于无监督的LDA主题模型对文本数据集进行主题分类,构建主题和术语双层过滤函数从主题分类的结果中提取早期预警信号,通过紧密中心度、主题权重以及主题自相关性三大度量函数评价主题的弱性,并基于主题内术语的归一化频率和概率提取出弱信号。最后,运用BERT深度学习模型从语义层面对弱信号上下文及其类似词进行扩展。[结果/结论] 以2021年1月初疫情重爆发事件为例,使用爆发前三月的社交媒体新闻数据集对构建的系统模型进行验证。实验结果表明,该方法可有效检测出相关弱信号,并挖掘出弱信号随时间推移逐渐增强的演化特性。此外,该融合模型在实现弱信号全自动识别的同时,也表现出较单一模型更强的结果可解释能力。  相似文献   

16.
[目的/意义]针对社会化标注系统用于数字档案资源组织后带来的资源检索与导航问题,提出依托主题图的数字档案资源聚合模型,以期提高数字档案资源检索效率并建立有序的可视化导航。[方法/过程]在剖析利用主题图实现社会化标注系统资源聚合相关研究现状的基础上,构建数字档案领域基于主题图的资源聚合模型,给出利用社会网络分析和形式概念分析析取数字档案资源主题图的主题类型、关联关系及资源指引三要素的体系化解决方案,从而实现数字档案标注系统资源聚合。[结果/结论]以NARA数字档案标注系统中的"Women at War"话题为例,利用所提方法并结合Ontopia工具实现目标话题的数字档案资源聚合,有效提高系统中数字档案资源的检索效率和导航效果。  相似文献   

17.
[目的/意义]基于时间网络影响力模型,研究微博话题的时变传播特性。[方法/过程]首先构建微博话题影响力网络模型,给出影响力网络的定义、关键因素分析、模型以及网络权值的计算方法,在此基础上,基于时间网络影响力模型研究微博话题时变传播特性,利用新浪微博平台及DATAMALL的最新微博话题数据仿真分析微博话题随时间的动态传播过程以及对用户的影响力强度。[结果/结论]微博话题随时间的动态传播过程以及对用户的影响力强度之仿真分析结果表明:约有93.3%的话题延迟在1-5小时以内,同时微博话题的影响力网络权值越高,相应的转发评论人数越多,微博话题的影响力也越大。最后将本文提出的TNIM模型与传统的影响力网络模型LDA进行对比,结果显示TNIM模型的影响力网络权值的准确性和稳定性都高于LDA模型,验证了TNIM模型的有效性。  相似文献   

18.
[目的/意义] 电子绘本种类繁多,交互丰富,对学龄前儿童吸引力强。相比阅读传统纸质绘本,学龄前儿童在阅读电子绘本时与父母的交流少。本文对这一现象进行深入分析,并解释以下两个研究问题:其一,当把交互功能降到最低时,父母和儿童之间的交流是否会增多;其二,在阅读传统纸质绘本时亲子交流的内容和行为。[方法/过程] 研究针对5-6岁的学龄前儿童以及其家长设计了实验,实验过程中,采用观察记录和录音两种方法收集数据,并采用扎根理论对数据进行分析。[结果/结论] 实验结果表明,去除大部分交互功能之后,在阅读电子绘本时父母和儿童之间的交流仍然很少。在阅读纸质绘本的过程中,儿童会通过提问和强化故事内容的方式来表达理解故事的需求,而父母不仅关注儿童对故事的理解程度,还关注儿童的阅读能力和阅读习惯。据此,提出一些针对电子绘本阅读和交互功能的设计建议及亲子阅读建议。  相似文献   

19.
[目的/意义]近些年来,创业生态系统已经成为创业研究的热点,但是从创业生态系统治理模式角度探索知识流动的研究尚不多见。因此,通过研究创业生态系统不同治理模式下企业间的知识流动特点,促进企业自身创新以及创新成果的扩散,进而带动整个创业生态系统良性发展。[方法/过程]结合创业生态系统治理模式的演化过程,对创业生态系统及其治理模式和知识流动进行界定,提出创业生态系统不同发展阶段的层级治理模式和关系治理模式,并构建不同治理模式下的企业间知识流动模型,即层级治理下的知识流动模型和关系治理下的知识流动模型。[结果/结论]在创业生态系统层级治理模式下,知识流动形成知识供应链;当治理模式处于层级治理和关系治理模式之间,知识流动从知识供应链向知识网络转变;当治理模式为关系治理时,知识流动方向具有多元化特点,形成知识网络。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号