排序方式: 共有42条查询结果,搜索用时 15 毫秒
1.
联系发现是数据挖掘中较新的研究领域。联系发现是一种对海量数据进行挖掘,找出其中潜在模式,抽取有用知识并发现隐藏联系的技术。本文首先综述了联系发现的概念、范围、特点和难点等,详细介绍了联系发现的几种主要方法:无监督的联系发现方法(新颖联系发现)、使用归纳逻辑程序技术挖掘关联数据的联系发现方法、多假设反演推理的联系发现方法、基于相关分析的联系发现方法以及KOJAK组队探测器,讨论了联系发现系统性能评估的方法与联系发现的置信区间度量方法,并简要描述了联系发现的一个具体应用的实例一——证据抽取和联系发现研究计划(EELD),最后探讨了目前联系发现研究中出现的问题及未来发展趋势。 相似文献
2.
为了能够有效地分析处理不完备的信息系统,必须对现有的Rough集模型进行扩充。分析研究了现有的几种比较有影响的基于Rough集的扩展关系,提出了一种处理不完备信息系统的约束非对称关系,并对这些扩充关系进行了分析比较。还提出了基于这种关系的上近似和下近似概念,以及正区域、近似精度、近似质量和依赖关系等相关概念。 相似文献
3.
利用Rough Set方法分析时间序列,已经取得了成果。时态信息系统(TIS)是时间序列的形式化表示。将时态信息系统转化为传统的信息系统(IS),是将Rough Set方法应用于时间序列挖掘的基础。目前,已有的将TLS转换为IS的方法,依赖于固定的时间间隔,具有一定的局限性。本文在已有算法的基础上,提出了两种改进方法,并结合Rough Set理论,使之适用于一般的时间序列的挖掘。 相似文献
4.
5.
一种基于多进化神经网络的分类方法 总被引:9,自引:0,他引:9
分类问题是目前数据挖掘和机器学习领域的重要内容.提出了一种基于多进化神经网络的分类方法CABEN(classification approach based on evolutionary neural networks).利用改进的进化策略和Levenberg-Marquardt方法对多个三层前馈神经网络同时进行训练.训练好各个分类模型以后,将待识别数据分别输入,最后根据绝对多数投票法决定最终分类结果.实验结果表明,该方法可以较好地进行数据分类,而且与传统的神经网络方法以及贝叶斯方法和决策树方法相比,在 相似文献
6.
数据挖掘算法处理海量数据时,扩展性受到制约。在商业和科学研究的各个领域,知识发现的过程和需求差异较大,需要有效的机制来设计和运行各种类型的分布式数据挖掘应用。提出了一种面向服务的云数据挖掘引擎的框架CloudDM。不同于基于网格的分布式数据挖掘框架,CloudDM利用开源云计算平台Hadoop处理海量数据的能力,以面向服务的形式支持分布式数据挖掘应用的设计和运行,并描述面向服务的云数据挖掘引擎系统的关键部件和实现技术。依据面向服务的软件体系结构和基于云平台的数据挖掘引擎,可以有效解决海量数据挖掘中的海量数据存储、数据处理和数据挖掘算法互操作性等问题。 相似文献
7.
8.
可变精度粗糙集β值的增量计算 总被引:1,自引:0,他引:1
目前对于可变精度粗糙集中变精度参数β计算的研究,主要集中在非增量方面.当处理大量数据时,需要能够动态计算的方法,本文提出了一种增量计算β值的方法ICObeta.该方法以分类质量作为确定性度量的标准,以最大确定性度量为目标,来选取合适的β值.ICObeta相比于非增量的方法,具有动态增量和计算开销显著降低的优点,并通过实验证实了增量计算的优点. 相似文献
9.
10.
情感分析也称为意见挖掘,是对文本中所包含的情感倾向进行分析的技术。目前很多情感分析工作都是基于纯文本的。而在微博上,除了文本,大量的图片信息也蕴含了丰富的情感信息。本文提出了一种基于文本和图像的多模态分类算法,通过使用潜在语义分析,将文本特征和图像特征分别映射到同维度下的语义空间,得到各自的语义特征,并用SVM-2K进行分类。利用新浪微博热门微博栏目下爬取的文字和配图的微博数据进行了实验。实验结果表明,通过融合文本和图像的语义特征,情感分类的效果好于单独使用文本特征或者图像特征。 相似文献