首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
王辉  张成锁  卓呈祥 《计算机工程》2011,37(10):167-169
提出一种改进的相对熵特征选择方法。该方法基于一个类别的文本属性通常由有限个特征词决定的特点,利用相对熵的基本原理,选取最能区分类内与类外文本的词作为文本分类的特征。在特定文本语料库中进行的实验结果表明,该方法可以降低文本特征维数,提高分类准确率。  相似文献   

2.
现有的基于粗糙集的数据补齐方法在计算任意两个对象之间的相似性时并没有考虑不同条件属性之间的差异性。针对这一问题,引入一种新的加权相似性的概念,并提出一种基于相对决策熵与加权相似性的粗糙集数据补齐算法RDNAWS。RDNAWS算法采用相对决策熵的概念来度量每个条件属性的重要性,并通过计算每个条件属性的重要性以及决策属性集对其的依赖性来为每个条件属性提供一个权值,从而将不同的条件属性有效地区分开来。在真实数据集上的实验表明,与现有的算法相比,所提算法能够获得更好的分类性能。  相似文献   

3.
This paper discusses the parameter and differentiation order identification of continuous fractional order KiBaM models in ARX (autoregressive model with exogenous inputs) and OE (output error model) forms. The least squares method is applied to the identification of nonlinear and linear parameters, in which the Grünwald-Letnikov definition and short memory principle are applied to compute the fractional order derivatives. An adaptive P-type order learning law is proposed to estimate the differentiation order iteratively and accurately. Particularly, a unique estimation result and a fast convergence speed can be arrived by using the small gain strategy, which is unidirectional and has certain advantages than some state-of-art methods. The proposed strategy can be successfully applied to the nonlinear systems with quasi-linear characteristics. The numerical simulations are shown to validate the concepts.   相似文献   

4.
5.
International Journal of Control, Automation and Systems - This paper proposes an iterative approach in fuzzy model predictive control. When the prediction model is nonlinear or uncertain,...  相似文献   

6.
基于最大交叉熵估计高斯混合模型参数的方法   总被引:2,自引:0,他引:2  
马继涌  高文 《软件学报》1999,10(9):974-978
传统的基于最大似然估计高斯混合模型参数的方法是一种无导师的学习方法.该方法的主要缺点是学习算法在估计一类模式模型中的参数时只利用了该类模式中的训练样本,而未考虑其他类训练样本分布的影响,因此,这种方法的识别效果往往不够理想.该文提出了利用最大交叉熵估计高斯混合模型参数的方法,这种方法考虑了不同类之间的样本区分性.同时,为了提高获得全局最优解的可能性,文章给出一种利用进化规划求解最优参数的算法,并将这种方法用于非限定文本的话者识别.实验表明,该方法比传统的参数估计方法识别效果要好.  相似文献   

7.
在分析已有不完备信息熵的基础上,提出一种基于相似关系的不完备信息熵,并证明该信息熵的若干性质.给出一个不完备数据特征选择算法,算法以改进的不完备信息熵作为特征选择准则,直接对不完备数据的特征进行熵值分析,并采用顺序前向浮动选择方法解决特征间的相关性问题.最后在UCI实测数据集上的实验表明,文中算法具有更高的准确率和更快的特征选择速度.  相似文献   

8.
朱鹏  李巍  李云春 《软件学报》2010,21(Z1):284-289
随着超级计算机的发展,其使用到的核心数逐渐达到数十万,而且运行于其上的应用的复杂性也不断加大.因此,开发人员需要对并行应用的性能进行测量,并做出分析,以便对程序源码进行优化,提高程序的执行效率.但是由于核心数的大量增加,对并行程序性能进行测量将得到海量的性能数据,如何处理海量性能数据,以便分析并行程序性能成为一个难点.介绍了一种基于迭代聚类的并行应用性能分析方法,该方法使用数据挖掘的聚类算法处理处理海量性能数据,并可以根据条件迭代执行,确定影响并行程序性能的函数和进程,然后通过贝叶斯信息准则评价聚类结果,以确定迭代聚类的可靠性,最后用实验证明了方法的有效性.  相似文献   

9.
针对离散值数据集特征选择问题,提出基于相对分类信息熵的进化特征选择算法.使用遗传算法搜索最优特征子集,使用相对分类信息熵度量特征子集的重要性.以相对分类信息熵作为适应度函数,使用二进制编码问题的解,使用赌轮方法选择产生下一代个体.实验表明文中算法在测试精度上优于其它方法,此外还从理论上证明文中算法的可行性.  相似文献   

10.
Several techniques have been proposed for tackling the Structure from Motion problem through factorization in the case of missing data. However, when the percentage of unknown data is high, most of them may not perform as well as expected. Focussing on this problem, an iterative multiresolution scheme, which aims at recovering missing entries in the originally given input matrix, is proposed. Information recovered following a coarse-to-fine strategy is used for filling in the missing entries. The objective is to recover, as much as possible, missing data in the given matrix. Thus, when a factorization technique is applied to the partially or totally filled in matrix, instead of to the originally given input one, better results will be obtained. An evaluation study about the robustness to missing and noisy data is reported. Experimental results obtained with synthetic and real video sequences are presented to show the viability of the proposed approach.
Antonio LópezEmail:
  相似文献   

11.
从人的认知特性出发,提出了一种基于交叉熵的文本图像识别方法.首先,把原图像和它的平滑图像组合起来构成广义图像,广义图像的直方图称为广义直方图;其次,利用广义直方图计算广义图像二值化前后的交又熵,得到图像最佳二值化阈值;最后,由最佳二值化阈值下的交叉熵和设定的交叉熵门限进行比较,实现文本图像的识别.实验结果与性能比较表明,本文方法在保证很高识剐率的同时,极大地降低了虚报率.  相似文献   

12.
余泽 《计算机系统应用》2014,23(12):125-130
混合属性聚类是近年来的研究热点,对于混合属性数据的聚类算法要求处理好数值属性以及分类属性,而现存许多算法没有很好得平衡两种属性,以至于得不到令人满意的聚类结果.针对混合属性,在此提出一种基于交集的聚类融合算法,算法单独用基于相对密度的算法处理数值属性,基于信息熵的算法处理分类属性,然后通过基于交集的融合算法融合两个聚类成员,最终得到聚类结果.算法在UCI数据集Zoo上进行验证,与现存k-prototypes与EM算法进行了比较,在聚类的正确率上都优于k-prototypes与EM算法,还讨论了融合算法中交集元素比的取值对算法结果的影响.  相似文献   

13.
正则化最小二乘分类(RLSC)是一种基于二次损失函数的正则化网络,其推广能力受模型参数影响,传统的模型选择方法是耗时的参数网格搜索.为此,提出一种新颖的AlignLoo模型选择方法,其关键在于将核参数与超参数分开优化,即最大化核-目标配准以选择最优核参数,最小化RLSC的留一法误差的界以选择最优超参数.该方法效率高且不需验证样本,并在IDA数据集上进行了测试,结果表明方法有效.  相似文献   

14.
该文提出的应用层多播QoS自适应方法建立在由多个单播HPF路径构成的多播树基础上,多播组成员节点在一个HPF会话中是接收者,而可能在其它一些HPF会话中作为转发器。多播树由最大瓶颈带宽生成树算法生成,媒体流的传输协议采用HPF,由最大瓶颈带宽生成树上的分支节点作转发器来实现速率自适应和包丢弃算法,以达到整个多播组的平均带宽利用最大化。  相似文献   

15.
王晓明  印莹 《计算机科学》2007,34(8):171-176
DNA微阵列技术使同时监测成千上万的基因表达水平成为可能.直接把传统聚类算法用于高维基因表达数据分析会受到"维难"的困扰.特征转换和特征选择是两种常用的降维方式,但前者产生的新特征难以用原来的领域知识解释,后者通常会丢失信息.另外,传统的聚类算法通常由用户指定聚类参数,参数设置不同对聚类结果有很大的影响.针对上述问题,本文提出了一种新的基于迭代扩张的微阵列数据聚类算法-CIS.它不采用特征转换和特征选择的方式,并自动确定聚类参数.CIS反复用最新得到的样本聚簇得到新的聚类基因,然后以新的基因聚簇为特征重新聚类样本,逐步求精,最终的结果容易解释且避免了信息的丢失.该方法降低了由于用户缺少领域知识引起的实验误差.CIS算法被应用于两个真实的微阵列数据集,实验结果证实了算法的有效性.  相似文献   

16.
与其他服务发现相比,工作流中的服务选择有着自身的特点。在目前情况下,大多数的服务选择只是从对服务本身需求的角度来考虑,并未涉及到多个服务之间的关联约束和协调性问题。而在工作流中,这些问题同样是影响服务选择的主要因素。本文提出一种服务选择算法,在该算法中,利用规则从多个方面来反映服务之间的约束关系并指导服务选择的方式,进一步对每个候选服务与相关联服务之间的兼容性进行了比较,最后得到一个同时满足自身和流程需求的服务。  相似文献   

17.
Avoid the common pitfalls experienced by many organizations that have established enterprise data standards by following a straightforward process. Standards should be defined around a simple framework and be borrowed from third parties or vendors wherever possible to save time. It is better to reuse, rather than reinvent or create standards. To be used successfully, standards must be easy to understand, have a proven track record, be easy to use, and be readily available. Standards should be maintained in a central repository such as Lotus Notes or on an intranet Web site so that they are readily accessible to project teams.  相似文献   

18.
基于数据挖掘技术的智能化入侵检测模型   总被引:1,自引:0,他引:1  
张巍 《计算机工程》2005,31(8):134-136,156
给出了一个基于数据挖掘技术智能化入侵检测模型,它由若干个对等式执行入侵检测功能的单元IDU(intrusion detection unit)组成,每个IDU参照通用入侵检测轮廓CIDF(common intrusion detection framcwork)构建,该模型采用关联规则,序列规则对数据进行挖掘,用判定树分类技术对获得的模式进行分类,实验表明,该模型具有较好的效益。  相似文献   

19.
一种建立粗糙数据模型的监督模糊聚类方法   总被引:6,自引:0,他引:6  
提出了在输入-输出积空间中利用监督模糊聚类技术快速建立粗糙数据模型(rough data model,简称RDM)的一种方法.该方法将RDM模型的分类质量性能指标与具有良好特性的Gustafson-Kessel(G-K)聚类算法结合在一起,并通过引入数据对模糊类的推定隶属度的概念,给出了将模糊聚类模型转化为粗糙数据模型的方法,从而设计出一种通过迭代计算使目标函数最小的两个必要条件方程来获取RDM模型的有效算法,将Kowalczyk方法的多维搜索过程变为以聚类数目为参数的一维搜索,极大地减少了寻优时间.与传统的粗糙集理论和Kowalczyk方法相比,提出的方法具有更好的数据概括能力和噪声数据处理能力.最后,通过不同的数据集实验测试,结果表明了该方法的有效性.  相似文献   

20.
目前,企业对数据集成的要求逐渐上升到语义层面。针对数据语义上的异构问题,提出了一种语义模型驱动的集成方式,并实现了语义模型应用框架;讨论了框架中语义模型驱动的数据属性匹配技术,该技术用于在语义模型已存在的前提下,通过提供映射的方法实现异构数据到已有模型的映射。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号