共查询到20条相似文献,搜索用时 15 毫秒
1.
软件可靠性数据是进行软件可靠性分析和估测的基础,在整个软件可行性研究中占着重要的地位。本文在汇总分析软件可靠数据的基础上,对其进行了合理的分类,从而提出一个套收集软件可靠性数据的系统化方法,并探讨了实现自动化收集软件可靠性数据的基本技术。 相似文献
2.
近年来.数据挖掘技术已成为国内外研究热点.而数据分类是数据挖掘中最重要的任务之一。本文介绍了一种神经模糊数据分类方法NEFCLASS模型,它通过从数据学习得到模糊分类规则.产生具有良好解释性的分类结果,分析了它的结构、学习算法和修减策略.还讨论了它的实现工具和应用。 相似文献
3.
4.
现有的针对分类数据的算法需要多次扫描数据库,对于数据开采经常处理的大容量数据,多遍I/O操作是一项沉重的系统开销.CACD(clustering algorithm for categoricaldata)是针对分类属性数据的聚类算法,该算法采用压缩技术缩小需要处理的数据量以提高效率,同时算法提出了一种新的基于压缩数据结构的标准用于衡量分类数据的相似度.CACD只需扫描数据库一遍,算法理论分析和实验分析都表明该算法比同类针对分类数据的聚类算法效率要高,并且压缩技术对聚类结果的质量影响不大. 相似文献
5.
He Ziqiang 《计算机科学技术学报》1998,13(6):547-551
In this paper the definition of order-sorted algebra is generalized by introducing transformation functions between subtypes and supertypes.According to our definition,a type needn‘t be a subset of its supertype and a record model may form an order-sorted algebra.A new definition of equation is given.It has also been proved that equational theories and describing single inheritance have the initial model. 相似文献
6.
7.
一种新的基于遗传算法的数据分类方法 总被引:5,自引:0,他引:5
当前分类算法还存在诸如伸缩性不强、可调性差、缺乏全局优化能力等问题.通过构造完全分类规则集,设计了一种有效的遗传编码方法,使得遗传算法的各种优良特性在数据分类中得到充分的运用,从而提出了一种新的数据分类算法,新算法有效提高了数据分类的准确性,较好克服了当前存在的缺点.最后,给出了实验结果,证实了算法的有效性. 相似文献
8.
9.
作者利用AutoCAD12.0版图形软件和C语言开发了道路CAD软件。在开发的过程中针道路CADK 所涉及数据的特点,按照交互式CAD的原理与软件工程的思想,提出了一些比较有效而实用的数据处理方法。 相似文献
10.
11.
模式分类方法是模式识别的关键。文中重点研究了支持向量机、BP神经网络、K近邻、朴素贝叶斯、线性判别分析和二次判别分析共六种模式分类方法,并利用MATLAB对UCI上的数据集进行了分类测试,根据测试结果分析了数据集的样本数、特征数、类别数对每一种模式分类方法的准确率和运行时间的影响。结果表明,在对一些小数据进行分类时,可以采用朴素贝叶斯、K近邻、线性判别分析方法,而对于大的数据集,支持向量机、BP神经网络、二次判别分析分类方法则比较适合,但对运行时间要求严格的分类不能采用BP神经网络方法。 相似文献
12.
模式分类方法是模式识别的关键。文中重点研究了支持向量机、BP神经网络、K近邻、朴素贝叶斯、线性判别分析和二次判别分析共六种模式分类方法,并利用MATLAB对UCI上的数据集进行了分类测试,根据测试结果分析了数据集的样本数、特征数、类别数对每一种模式分类方法的准确率和运行时间的影响。结果表明,在对一些小数据进行分类时,可以采用朴素贝叶斯、K近邻、线性判别分析方法,而对于大的数据集,支持向量机、BP神经网络、二次判别分析分类方法则比较适合,但对运行时间要求严格的分类不能采用BP神经网络方法。 相似文献
13.
14.
数据挖掘中适用于分类的时序数据特征提取方法 总被引:1,自引:1,他引:0
特征提取在提高分类的准确性中起着非常关键的作用.对时序特征提取的方法进行归纳分类,将有利于对特征提取整体性,全面性的认识.回顾现有的时间序列中特征提取的方法,将其总结为四大类,它们分别是基于基本统计方法的特征提取、基于模型的特征提取、基于变换的特征提取、基于分形维数的特征提取.针对每一类的特征提取方法,进一步研究了它相应的分类方法和它在时间序列数据中的应用邻域. 相似文献
15.
李晓峰 《计算机与数字工程》2013,41(5)
数据标准化问题是制约我军信息化建设的瓶颈,分类与编码问题则是标准化过程中的重点与难点.论文针对无人机数据编码格式不规范、利用率低等问题,以现有数据分类、编码方式为基础,提出了按照数据管理层次和业务领域进行二维分类的方法,并以此为基础进行无人机数据编码设计. 相似文献
16.
17.
基于DNA微阵列基因表达数据的分类方法研究 总被引:1,自引:1,他引:0
介绍了目前几种基于DNA微阵列基因表达数据的分类方法。分别阐述了递归分割法、构建森林法以及信息融合方法的算法思想,对每种方法进行了深入描述,并对它们进行了分析和比较。最后对基于基因表达微阵列数据的分类技术进行了展望。 相似文献
18.
现实中许多领域产生的数据通常具有多个类别并且是不平衡的。在多类不平衡分类中,类重叠、噪声和多个少数类等问题降低了分类器的能力,而有效解决多类不平衡问题已经成为机器学习与数据挖掘领域中重要的研究课题。根据近年来的多类不平衡分类方法的文献,从数据预处理和算法级分类方法两方面进行了分析与总结,并从优缺点和数据集等方面对所有算法进行了详细的分析。在数据预处理方法中,介绍了过采样、欠采样、混合采样和特征选择方法,对使用相同数据集算法的性能进行了比较。从基分类器优化、集成学习和多类分解技术三个方面对算法级分类方法展开介绍和分析。最后对多类不平衡数据分类研究领域的未来发展方向进行总结归纳。 相似文献
19.
有的分类预测应用中,对象的信息隐藏在其对应着的大量简单记录中。为了对这样的对象进行分类预测,需要将大量的简单记录转换为特征向量。本文针对这种情况提出了基于数据立方体的特征提取方法,本方法由特征数据立方体构造算法和数据立方体特征向量构造算法组成.能够仅以扫描记录集合一遍的代价计算不同粒度的多种统计量并构造特征向量。 相似文献
20.
基于规则的分类数据离群挖掘方法研究 总被引:15,自引:0,他引:15
离散数据的挖掘(outlier minign,简称离群挖掘)是数据挖掘的重要内容,现有的离群数据挖掘算法大多对分类数据(categorical data)缺乏有效的处理,提出了基于规则的分类数据离群挖掘方法,采用多层最大离群支持度maxsup,搜索离群规则,有效地解决了这一问题,用这一方法对医学流行病数据进行了各种,分析了该方法的适用范围、性能,验证了方法正确性;另外,实验表明,经过离散化后,基于 相似文献