首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
软件可靠性数据是进行软件可靠性分析和估测的基础,在整个软件可行性研究中占着重要的地位。本文在汇总分析软件可靠数据的基础上,对其进行了合理的分类,从而提出一个套收集软件可靠性数据的系统化方法,并探讨了实现自动化收集软件可靠性数据的基本技术。  相似文献   

2.
近年来.数据挖掘技术已成为国内外研究热点.而数据分类是数据挖掘中最重要的任务之一。本文介绍了一种神经模糊数据分类方法NEFCLASS模型,它通过从数据学习得到模糊分类规则.产生具有良好解释性的分类结果,分析了它的结构、学习算法和修减策略.还讨论了它的实现工具和应用。  相似文献   

3.
不平衡数据集的分类方法研究   总被引:2,自引:0,他引:2  
传统的分类算法在处理不平衡数据分类问题时会倾向于多数类,而导致少数类的分类精度较低。针对不平衡数据的分类,首先介绍了现有不平衡数据分类的性能评价;然后介绍了现有常用的基于数据采样的方法及现有的分类方法;最后介绍了基于数据采样和分类方法结合的综合方法。  相似文献   

4.
现有的针对分类数据的算法需要多次扫描数据库,对于数据开采经常处理的大容量数据,多遍I/O操作是一项沉重的系统开销.CACD(clustering algorithm for categoricaldata)是针对分类属性数据的聚类算法,该算法采用压缩技术缩小需要处理的数据量以提高效率,同时算法提出了一种新的基于压缩数据结构的标准用于衡量分类数据的相似度.CACD只需扫描数据库一遍,算法理论分析和实验分析都表明该算法比同类针对分类数据的聚类算法效率要高,并且压缩技术对聚类结果的质量影响不大.  相似文献   

5.
In this paper the definition of order-sorted algebra is generalized by introducing transformation functions between subtypes and supertypes.According to our definition,a type needn‘t be a subset of its supertype and a record model may form an order-sorted algebra.A new definition of equation is given.It has also been proved that equational theories and describing single inheritance have the initial model.  相似文献   

6.
区域管理信息系统数据分类体系与编码结构   总被引:2,自引:0,他引:2  
  相似文献   

7.
一种新的基于遗传算法的数据分类方法   总被引:5,自引:0,他引:5  
当前分类算法还存在诸如伸缩性不强、可调性差、缺乏全局优化能力等问题.通过构造完全分类规则集,设计了一种有效的遗传编码方法,使得遗传算法的各种优良特性在数据分类中得到充分的运用,从而提出了一种新的数据分类算法,新算法有效提高了数据分类的准确性,较好克服了当前存在的缺点.最后,给出了实验结果,证实了算法的有效性.  相似文献   

8.
银行信用卡分类挖掘数据的预处理   总被引:9,自引:0,他引:9  
翟凌慧  马少平  唐焕玲 《计算机工程》2003,29(11):195-196,F003
描述了信用卡数据分类挖掘中的数据预处理过程,先从纷杂的应用数据中选择与分析主题有关的数据表,经过一系列数据库操作,从这些数据表中获得样本的输入信息,然后从交易历史信息中抽象出对样本分类的相关参数,将分类标准量化后得到对样本的分类。最后经过数据规格化、异常处理、缺失处理等数据清理方法对样本数据进行加工,得到分类挖掘所需的样本数据。  相似文献   

9.
作者利用AutoCAD12.0版图形软件和C语言开发了道路CAD软件。在开发的过程中针道路CADK 所涉及数据的特点,按照交互式CAD的原理与软件工程的思想,提出了一些比较有效而实用的数据处理方法。  相似文献   

10.
不平衡数据分类研究综述   总被引:2,自引:1,他引:1  
赵楠  张小芳  张利军 《计算机科学》2018,45(Z6):22-27, 57
在很多应用领域中,数据的类别分布不平衡,如何对其正确分类是数据挖掘和机器学习领域中的研究热点。经典的数据分类算法未考虑数据类别的不平衡性,认为类别之间的误分类代价相同,导致不平衡数据分类的效果不理想。针对数据分类的各个步骤,相继提出了不同的不平衡数据分类处理方法。对多年来的相关研究成果进行归类分析,从特征选择、数据分布调整、分类算法、分类结果评估等几个方面系统地介绍了相关方法,并探讨了进一步的探索方向。  相似文献   

11.
模式分类方法是模式识别的关键。文中重点研究了支持向量机、BP神经网络、K近邻、朴素贝叶斯、线性判别分析和二次判别分析共六种模式分类方法,并利用MATLAB对UCI上的数据集进行了分类测试,根据测试结果分析了数据集的样本数、特征数、类别数对每一种模式分类方法的准确率和运行时间的影响。结果表明,在对一些小数据进行分类时,可以采用朴素贝叶斯、K近邻、线性判别分析方法,而对于大的数据集,支持向量机、BP神经网络、二次判别分析分类方法则比较适合,但对运行时间要求严格的分类不能采用BP神经网络方法。  相似文献   

12.
模式分类方法是模式识别的关键。文中重点研究了支持向量机、BP神经网络、K近邻、朴素贝叶斯、线性判别分析和二次判别分析共六种模式分类方法,并利用MATLAB对UCI上的数据集进行了分类测试,根据测试结果分析了数据集的样本数、特征数、类别数对每一种模式分类方法的准确率和运行时间的影响。结果表明,在对一些小数据进行分类时,可以采用朴素贝叶斯、K近邻、线性判别分析方法,而对于大的数据集,支持向量机、BP神经网络、二次判别分析分类方法则比较适合,但对运行时间要求严格的分类不能采用BP神经网络方法。  相似文献   

13.
近年来,在数字政府、智慧交通建设背景下,交通政务数据共享、开发与应用越来越重要,数据应用与业务开展越来越紧密,一体化数据体系建设越来越迫切。因此,全面而准确地认识这些挑战,并采取有效的应对举措,势在必行且意义重大。本文通过透视交通行业数据应用实际情况,思考交通行业数据治理发展思路。  相似文献   

14.
数据挖掘中适用于分类的时序数据特征提取方法   总被引:1,自引:1,他引:0  
林珠  邢延 《计算机系统应用》2012,21(10):224-229
特征提取在提高分类的准确性中起着非常关键的作用.对时序特征提取的方法进行归纳分类,将有利于对特征提取整体性,全面性的认识.回顾现有的时间序列中特征提取的方法,将其总结为四大类,它们分别是基于基本统计方法的特征提取、基于模型的特征提取、基于变换的特征提取、基于分形维数的特征提取.针对每一类的特征提取方法,进一步研究了它相应的分类方法和它在时间序列数据中的应用邻域.  相似文献   

15.
数据标准化问题是制约我军信息化建设的瓶颈,分类与编码问题则是标准化过程中的重点与难点.论文针对无人机数据编码格式不规范、利用率低等问题,以现有数据分类、编码方式为基础,提出了按照数据管理层次和业务领域进行二维分类的方法,并以此为基础进行无人机数据编码设计.  相似文献   

16.
冯建  Janusz  Starzyk  邱菀华 《控制与决策》2012,27(2):211-215
讨论一种基于信息熵的神经网络数据分类方法,通过所有神经元的统计权重信息对输入数据进行投票分类.这种多层网络结构以及基于信息量的分割算法,使得它在数据分类问题上比现有的多数神经网络具有更好的表现.其并行的可扩展结构适合硬件实现,能够提高实际运算速度,适合用来处理金融方面高维度、复杂的海量数据问题.  相似文献   

17.
基于DNA微阵列基因表达数据的分类方法研究   总被引:1,自引:1,他引:0  
介绍了目前几种基于DNA微阵列基因表达数据的分类方法。分别阐述了递归分割法、构建森林法以及信息融合方法的算法思想,对每种方法进行了深入描述,并对它们进行了分析和比较。最后对基于基因表达微阵列数据的分类技术进行了展望。  相似文献   

18.
现实中许多领域产生的数据通常具有多个类别并且是不平衡的。在多类不平衡分类中,类重叠、噪声和多个少数类等问题降低了分类器的能力,而有效解决多类不平衡问题已经成为机器学习与数据挖掘领域中重要的研究课题。根据近年来的多类不平衡分类方法的文献,从数据预处理和算法级分类方法两方面进行了分析与总结,并从优缺点和数据集等方面对所有算法进行了详细的分析。在数据预处理方法中,介绍了过采样、欠采样、混合采样和特征选择方法,对使用相同数据集算法的性能进行了比较。从基分类器优化、集成学习和多类分解技术三个方面对算法级分类方法展开介绍和分析。最后对多类不平衡数据分类研究领域的未来发展方向进行总结归纳。  相似文献   

19.
郑敏姜 《福建电脑》2010,26(3):18-20
有的分类预测应用中,对象的信息隐藏在其对应着的大量简单记录中。为了对这样的对象进行分类预测,需要将大量的简单记录转换为特征向量。本文针对这种情况提出了基于数据立方体的特征提取方法,本方法由特征数据立方体构造算法和数据立方体特征向量构造算法组成.能够仅以扫描记录集合一遍的代价计算不同粒度的多种统计量并构造特征向量。  相似文献   

20.
基于规则的分类数据离群挖掘方法研究   总被引:15,自引:0,他引:15  
离散数据的挖掘(outlier minign,简称离群挖掘)是数据挖掘的重要内容,现有的离群数据挖掘算法大多对分类数据(categorical data)缺乏有效的处理,提出了基于规则的分类数据离群挖掘方法,采用多层最大离群支持度maxsup,搜索离群规则,有效地解决了这一问题,用这一方法对医学流行病数据进行了各种,分析了该方法的适用范围、性能,验证了方法正确性;另外,实验表明,经过离散化后,基于  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号