共查询到20条相似文献,搜索用时 0 毫秒
1.
[目的]对科技文献挖掘的主要工具、系统平台和关键技术进行全面系统梳理,指出未来发展趋势,为相关研究提供参考.[方法]通过网络和文献调研等方法梳理科技文献挖掘的历史发展脉络,总结科技文献挖掘的主要工具、系统平台及其特点,从平台功能、数据类型、可视化功能等维度进行了对比分析,重点介绍科技文献挖掘的关键技术及其发展前沿.[结... 相似文献
2.
基因相关生物医学文献挖掘研究 总被引:1,自引:0,他引:1
系统生物学研究产生的大量生物医学文献包含了丰富的生物学知识。生物医学文献挖掘能够利用海量文献资源,获取国际上生命科学最新研究成果。我们开发了基因相关文献挖掘网络平台,应用自然语言处理技术,集成了文献自动采集工具、句法分析器、Gene Ontology等最新的生物医学领域知识库,能够对文献进行深度挖掘,进行基因功能、基因与疾病关系、生物分子相互作用网络知识发现.辅助形成生物科学研究创新假设,挖掘准确率可达86%。 相似文献
3.
系统生物学研究产生的大量生物医学文献包含了丰富的生物学知识。生物医学文献挖掘能够利用海量文献资源,获取国际上生命科学最新研究成果。我们开发了基因相关文献挖掘网络平台,应用自然语言处理技术,集成了文献自动采集工具、句法分析器、Gene Ontology等最新的生物医学领域知识库,能够对文献进行深度挖掘,进行基因功能、基因与疾病关系、生物分子相互作用网络知识发现,辅助形成生物科学研究创新假设,挖掘准确率可达86%。 相似文献
4.
热点识别是文献分析的重要任务之一,针对专业领域的文献分析有助于研究人员快速掌握相关领域的核心问题。从图挖掘的角度利用复杂网络的社区识别技术来识别我国的林业科技文献的研究热点,并且分析这些热点之间的关联关系。以2000-2012年林业科技文献为研究对象,构建了一个文献关键词共现加权网络,从社区结构的角度分析了该网络的拓扑特性。结果显示该网络具有明显的小世界特征、无标度特征和八大社区结构。这八个社区分别对应着林业领域的八大主题研究领域,以可视化的方式展示了每个主题域由一系列的热点组成,主题域之间也呈现了疏密的关系。因此,所采用的网络分析方法可以作为科技文献推荐系统的核心方法。 相似文献
5.
日志挖掘中的数据预处理 总被引:1,自引:0,他引:1
日志信息的预处理是日志挖掘任务中的重要阶段,是当前研究的重点,同时也是整个日志挖掘过程的基础和实施有效挖掘算法的前提,在日志挖掘中起着重要的作用.目前主要的日志挖掘主要采用国外的几种软件,而日志挖掘中重要的数据预处理软件国内暂无.文中主要介绍了数据挖掘中的日志挖掘,分析了数据预处理的过程,以及如何实现日志挖掘中的数据预处理,并在Delphi开发工具中成功完成了IIS文本日志文件到Xls格式及XNIL格式文件的转换,实现了日志挖掘中的数据预处理. 相似文献
6.
李国慧 《数字社区&智能家居》2008,(2):592-595
基于web的数据挖掘是一个结合数据挖掘和WWW的热门研究主题,它是现代科学技术相互渗透与融合的必然结果。本文阐述了Web数据挖掘的定义、分类和过程,并对Web数据挖掘的应用与发展前景进行了探讨。 相似文献
7.
随着时间的推移,软件不断地更新和演化,软件仓库中累积了海量的数据,如何有效地收集、组织、利用软件工程中涌现的软件大数据是一个至关重要的问题.软件仓库挖掘(mining software repositories, MSR)通过挖掘软件仓库中繁杂多变的数据中蕴含的知识来提高软件的质量和生产效率.虽然一些研究工作详细阐述了MSR的背景、历史和前景,但现有的研究工作并未系统地呈现MSR领域中最有影响力的作者、机构、国家以及最受欢迎的研究主题和主题变迁等领域知识.因此,结合已有的经典的文献分析框架和算法来分析MSR相关文献,并呈现一些MSR基本领域知识.为了实现MSR 文献分析,建立了一个包含3个组件的MSR文献分析框架(MSR publication analysis framework, MSR-PAF),这3个组件分别被用来创建数据集、执行基础文献分析、实施合作模式分析.基础文献分析结果表明:最高产的作者、机构、国家地区分别是Ahmed E. Hassan,University of Victoria和美国,最有影响力作者是Ahmed E. Hassan,最频繁的关键词是software maintenance.合作模式分析的结果显示Abram Hindle是MSR领域最活跃的作者,open source project和software maintenance是最流行的研究主题. 相似文献
8.
LI Guo-hui 《数字社区&智能家居》2008,(4)
基于Web的数据挖掘是一个结合数据挖掘和WWW的热门研究主题,它是现代科学技术相互渗透与融合的必然结果。本文阐述了Web数据挖掘的定义、分类和过程,并对Web数据挖掘的应用与发展前景进行了探讨。 相似文献
9.
Web数据挖掘的分析与探索 总被引:14,自引:0,他引:14
随着WWW上信息量的不断增加,如何在信息海洋中找到真正需要的内容,成了专家学者关注的焦点,Web数据挖掘就是一个很好的途径。在讨论了Web使用模式的挖掘流程及挖掘技术后,架构了一种Web使用模式挖掘工具。 相似文献
10.
张启杰 《自动化技术与应用》2023,(1):100-103
由于当前已有方法考虑警务特征挖掘问题,导致警务体能训练结果不理想。为了有效解决上述问题,提出一种基于大数据技术背景下警务体能训练方法。将警务人员的体能测试数据作为研究对象,通过关联规则技术分析测试项之间的关联,同时进一步优化提升测试指标,挖掘警务体能特征。在大数据技术背景下,通过警务体能特征提取结果,针对不同的警务人员,分别给出不同的体能训练方法。仿真实验结果表明,所提方法能够有效提升警务体能,获取满意的警务体能训练结果。 相似文献
11.
日志信息的预处理是日志挖掘任务中的重要阶段,是当前研究的重点,同时也是整个日志挖掘过程的基础和实施有效挖掘算法的前提,在日志挖掘中起着重要的作用。目前主要的日志挖掘主要采用国外的几种软件,而日志挖掘中重要的数据预处理软件国内暂无。文中主要介绍了数据挖掘中的日志挖掘,分析了数据预处理的过程,以及如何实现日志挖掘中的数据预处理,并在Delphi开发工具中成功完成了IIS文本日志文件到Xls格式及XML格式文件的转换,实现了日志挖掘中的数据预处理。 相似文献
12.
14.
15.
通过分析有关高效用模式挖掘(high utility pattern mining,HUPM)最先进的方法,对其进行全面和结构化的概述。首先,通过介绍HUPM的相关概念、公式并给出应用示例,对HUPM有更深一步的理解;针对用于挖掘不同类型HUPM的最常见和最先进的关键技术进行分类,包括基于Apriori、基于树、基于列表、基于映射、基于垂直/水平数据格式、基于索引等方法。针对现有关键技术的用途和优缺点进行了全面概述,由于静态数据难以满足实际需要,总结了在数据流上应用的HUPM方法,主要包括基于增量方法、基于滑动窗口模型方法、基于时间衰减模型方法、基于地标模型方法等。最后,给出了现有技术的不足和改进方向,并且有针对性地提出了新的研究方法。 相似文献
16.
Web数据挖掘初探 总被引:1,自引:0,他引:1
伍粤山 《数字社区&智能家居》2006,(17)
Web上有海量的数据信息,对这些数据进行复杂的应用成了现今数据库技术的研究热点。这里对数据挖掘的基本概念、Web数据挖掘步骤、Web数据挖掘在三个研究领域的研究现状、发展及常用Web数据挖掘工具做了简单介绍,希望起到抛砖引玉作用。 相似文献
17.
近年来,计算机科学技术快速发展,在人们的生活、工作和学习中发挥着越来越重要的作用。计算机互联网的信息资源非常丰富,与此同时碎片化、海量的数据信息在很大程度上增加了人们获取有价值信息的成本和时间。当前云计算平台下的Web数据挖掘技术为海量数据信息的处理和分析提供了极大的便利,通过研究云计算平台下的Web数据挖掘,进一步完善和优化Web结构数据挖掘技术,降低大量数据信息存储和处理的成本,提高系统运行效率。本文简要介绍了云计算和Web数据挖掘,阐述了云计算平台下的Web数据挖掘系统。 相似文献
18.
19.
Web使用挖掘技术研究综述 总被引:10,自引:0,他引:10
Web使用挖掘就是利用数据挖掘技术从Web数据中发现用户使用模式的过程.该介绍了Web使用挖掘的定义和背景知识,对Web使用挖掘的3个阶段:预处理,模式发现和模式分析进行详细的说明;深入研究了具体应用中的发展方向和所要解决的关键技术;对将来Web使用挖掘领域的研究问题作了展望. 相似文献
20.
Web日志挖掘数据预处理研究 总被引:6,自引:0,他引:6
随着WWW的广泛应用及相应的Web技术的出现,数据挖掘的研究也进入了一个新的阶段。Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面,而数据预处理在Web日志挖掘过程中起着至关重要的作用。Web日志挖掘就是运用数据挖掘的思想来对服务器日志进行分析处理。本文针对基于日志的数据挖掘,提出了前期的几种数据预处理方法,目的是分割服务器日志为多个独一无二的用户的一次访问序列,并给予了算法实现。 相似文献