排序方式: 共有60条查询结果,搜索用时 0 毫秒
1.
本文利用大规模搜索日志对用户中文长句查询的情况进行了统计研究.通过分析搜索日志中的中文长句查询确定了经常发生的查询类型特点,并对用户搜索行为与查询长度、查询类型和查询频率的关系进行了研究.进一步了解了session中用户查询词修改情况,总结了用户查询修改方法和长度修改方面的特征和规律.最后,将不同长度的查询放到了三个商业搜索引擎中分别进行检索,计算其重叠率.通过以上的分析研究发现虽然目前大部分查询都是短查询,但短查询并不能满足用户所有的检索需求,特别是在搜索引擎向语义检索不断发展的今天,长句检索的分析和利用能够从更深层次上了解用户的查询用语特点和搜索点击行为,这对于查询技术的改进和语义空间的构建都具有积极的作用. 相似文献
2.
[目的/意义] 学科主题演化研究有助于掌握学科发展现状、研究热点、研究前沿和发展趋势等情况,是进行科技创新的基础,是面向科技创新的重要研究方向。[方法/过程] 提出一种语义分类的学科主题演化分析方法:将关键词分为研究问题、研究方法和研究技术3类,构建不同语义分类的共词网络;然后基于Fast Unfolding社区发现算法识别具有语义特征的社区(主题);利用相似度算法计算相邻子时期主题间的相似度,构建学科主题演化图谱,以分析某学科领域研究问题、研究方法和研究技术的变化,实现深度、细致的学科主题演化分析。[结果/结论] 通过对2012-2015年CNKI数据库收录的我国大数据研究领域相关论文数据的处理分析,证明该方法的准确性和有效性。 相似文献
3.
4.
k-clique社区知识创新演化方法研究 总被引:3,自引:0,他引:3
提出一种基于k-clique社区的知识创新演化揭示方法。首先,构建科技文献时序关键词共词网络。然后,将共词网络划分为n个最大完整子网络Gs,在Gs中寻找k-clique(2 < k < s)。最后,在给定阈值k的情况下,计算k-clique社区的演化情况,从而揭示知识创新情况。该方法不仅能够有效揭示知识创新演化过程,而且能够通过k-clique社区的关键节点,揭示知识创新过程中的共性知识以及不同知识创新领域的互相影响情况。通过对碳纳米管研究领域2008-2012年SCI数据库论文数据的实验证明,该方法能准确识别出该领域知识创新主要方向,并能准确反映其演化情况。 相似文献
5.
[目的/意义]当前生成式人工智能的发展对社会产生了强烈冲击。为响应国家创新发展的迫切需求,如何利用生成式人工智能更好地完成情报工作,以满足用户的情报需求,已成为当前情报学领域关注的热点问题。[方法/过程]基于供需理论提出从数据供给侧(Supply)、智慧情报分析中台(Analysis)、情报需求侧(Demand)三方构建生成式人工智能赋能情报工作范式模型——SAD范式模型,深入分析生成式人工智能赋能情报工作机理,并结合国际前沿项目案例探讨生成式人工智能与情报工作的前瞻性融合发展。[结果/结论]生成式人工智能赋能情报工作范式模型SAD,可以更好地促进生成式人工智能赋能情报工作的各个环节,提高情报工作效率,为情报工作范式研究提供了新思路。 相似文献
6.
[目的/意义]分析科技创新路径识别研究中用到的主要研究方法与开源工具,提出利用引文内容挖掘实现科技创新路径识别方法及开源工具。[方法/过程]首先,基于引文分析、结构洞分析、凝聚子群分析、文本内容挖掘、引文内容挖掘等不同角度分析了科技创新路径识别的主要方法;其次,从数据源、文本格式、挖掘内容、处理能力等方面阐述了用于实现引文内容挖掘的科技创新路径识别的3个开源工具:Mallet、Knime、NLTK;最后,分析了实现科技创新路径可视化的5个开源工具:Pajek、Ucinet、Gephi、D3.js、VOSViewer。[结果/结论]通过研究发现,利用开源工具深入挖掘引文内容中蕴含的丰富语义信息,识别不同引用动机,进而进行可视化展示可以有效的实现科技创新路径表达。 相似文献
7.
介绍了一种新的智能信息载体iButton的工作原理及其特点,介绍了iButton在我校图
书馆中应用情况,展现了其广阔的应用前景。 相似文献
书馆中应用情况,展现了其广阔的应用前景。 相似文献
8.
国外主要可视化数据挖掘开源软件的比较分析研究 总被引:1,自引:0,他引:1
选取了WEKA、RapidMiner、KNIME和Orange四种国外主要的可视化数据挖掘开源软件,对它们在数据挖掘方法、可视化功能、使用容易程度等方面进行了比较.通过比较发现RapidMiner具有丰富的算法和优秀的可视化效果,而WEKA和KNIME在算法上较Orange要多,但Orange 在可视化功能上要比两者强.所以四种软件都有各自的适用范围,可以适用不同操作用户的需求. 相似文献
9.
10.
基于引文内容分析的引用情感识别研究 总被引:1,自引:0,他引:1
[目的/意义]针对自动识别论文引用情感问题,提出一种基于引文内容分析的识别方法并进行可视化展示,克服基于简单引用频次计量无法区分不同引用情感的问题。[方法/过程]首先,利用正则表达式抽取出论文全文中的引文内容信息;然后,利用TF-IDF算法筛选出引用情感特征词,结合情感词典,利用情感分析技术对引文内容进行引用情感识别;最后,利用可视化工具展示出引用情感整体分布情况。[结果/结论]该方法能够有效识别出抗衰老领域论文数据集中引用情感情况。实验结果显示,该领域正面引用占总引用次数的21%,中立引用占总引用次数的78%,负面引用仅占总引用次数的1%。与传统引文网络相比较,基于引用情感的可视化图谱可以有效识别出不同引用情感在整体数据集合上的分布情况。 相似文献