排序方式: 共有166条查询结果,搜索用时 140 毫秒
31.
基于主题模型的科技报告文档聚类方法研究 总被引:1,自引:0,他引:1
[目的/意义]探索实践以科技报告为文献载体形式的融合主题模型的文本聚类方法,拓展基于科技文献进行技术监测服务的新领域,提出基于科技报告进行语义分析的新方法。[方法/过程]以国家科技报告服务系统中的科技报告为数据源,首先基于LDA主题模型对经过文本预处理的科技报告进行主题挖掘,再基于Ward与K-means相结合的聚类算法对包含主题分布信息的文本向量进行聚类分析,尝试提出一种适合科技报告文档聚类的文本挖掘新方法。[结果/结论]实验结果表明,LDA主题模型能有效准确挖掘科技报告中的主题信息,所提出的Ward与K-means相结合的聚类算法对科技报告的聚类效果也优于其它传统聚类算法。 相似文献
32.
33.
应用基于期刊"引文-文本"拟合相似度的混合聚类算法对Web of Science中SCI、SSCI、A&HCI收录的8 305余种期刊进行聚类分析,并将期刊混合聚类结果与基本科学指标ESI学科分类体系进行比较研究。对于聚类结果与ESI体系相一致的期刊,认为其具有较强的"学科关联度",定义为相应学科领域的"学科内核",其余部分则为"学科外围"。"内核期刊"界定了相应学科的核心知识范围,"外围期刊"则诠释了不同学科的分化和交叉融合等结构特征。 相似文献
34.
基于关键词和摘要相关度的文献聚类研究 总被引:1,自引:0,他引:1
现有的文献聚类方法都是通过文献关键词来进行的.本文在研究大量文献聚类方法的基础上,提出了一种通过文献关键词和摘要进行加权的新的文献聚类算法.首先,改进了传统相似度计算的方法,设计出基于关键词和摘要词加权的相似度公式,使文献相似度计算更加精确.其次,基于"文献距离越大,聚为一类的概率越小"的思想,提出了一种"最大距离聚类法",并给出了算法的详细步骤.最后,实现算法并进行了大量的实验仿真.通过改进相似度计算公式,调整关键词和摘要词的权重,提高了聚类的质量.结果表明,本文提出的文献聚类算法是一种行之有效的方法. 相似文献
35.
期刊共引分析及可视化实证研究——以图书情报学研究为例 总被引:3,自引:0,他引:3
文章利用ISI的Web of Science中的SSCI数据库,对1996~2008年8月期间收录的24种图书情报学核心期刊引文进行了期刊共引分析,并绘制了图书情报科学研究的知识图谱.知识图谱显示,目前国际图书情报学领域主要分为图书馆学和情报学两大部分.图书馆学研究大致包括网络资源组织、数字图书馆、开放获取、知识组织、用户服务等主流学科领域;情报学大致包括网络计量研究、信息(引文)计量研究、科学计量学理论、科研指标与评价、信息检索及用户检索行为理论研究、电子信息系统与服务及用户行为研究等主流学科领域. 相似文献
36.
[目的/意义] 基于高维矩阵稀疏降维的思想,提出一种利用惩罚性矩阵分解(Penalized Matrix Decomposition,PMD)实现共词分析的新方法。[方法/过程] 以"学科服务"为研究主题,根据PMD算法原理,在Matlab环境下分别实现特征词的提取、特征词的软聚类以及聚类效果的可视化。[结果/结论] 与传统的共词分析方法对比,PMD算法在共词分析中具有独特的优势:提取的特征词比较全面,聚类数目便于确定,聚类结果易于理解。 相似文献
37.
[目的/意义]基于专利共被引聚类和专利组合分析构建关键技术识别分析框架,可为产业、企业决策和规划提供参考依据。[方法/过程]首先通过专利共被引聚类获得若干个聚类簇;再通过领域专家对聚类簇进行判读和命名;最后从专利活动和专利质量两个维度对聚类簇进行专利组合分析,其中专利申请数量和被引频次均较高的专利簇即为关键技术。[结果/结论]与已有方法比较研究表明,本方法不仅可以有效识别产业关键技术,还能在中观的产业层面揭示出切合实际需求的技术方向,也可为企业根据自身需求制定不同的技术发展战略提供指导。 相似文献
38.
[目的/意义] 为提高引文网络的社团划分的准确性,提出一种基于加权的引文网络的社团划分方法。[方法/过程] 以Louvain社团划分方法为算法基础,将科学论文用向量空间模型表示,利用改进的余弦相似度方法计算相邻论文之间的相似度,并将其作为权重,综合考虑论文内容属性与结构属性,提出一种基于样本加权的引文网络社团划分方法。[结果/结论] 该算法将引文网络中论文的文本内容属性与拓扑结构属性结合起来,通过对Scientometrics期刊发表的论文以及主题为CRISPR的论文进行社团划分研究实验,结果表明该方法能改善引文网络社团的划分效果。 相似文献
39.
国内外专利挖掘研究(2005-2014)综述 总被引:1,自引:0,他引:1
在中国知网、万方数据和Web of Science进行检索,获得72篇相关中文文献和98篇英文文献,并从中选出66篇进行综述。专利挖掘研究包括术语抽取、聚类、分类、以复杂网络为基础的方法、以时间为基础的方法和基于专利挖掘的技术研究等6个主题。尽管近10年来这一领域发展较快,但是部分研究也存在试验验证不精确、基于IPC的自动分类效果不好、所要解决的问题不明确且局限于方法应用和粒度粗糙等问题。专利挖掘研究应该注重发现问题,而非简单地应用方法。 相似文献
40.