首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 990 毫秒
1.
针对传统FCM算法无法获得令人满意的聚类结果的问题,提出了基于样本与特征双加权的自适应FCM聚类算法。采用特征和样本双加权的策略,以特征权重信息熵作为代价函数,与样本权重、特征权重相融合,通过迭代优化的方法动态计算各属性特征对不同类别的权重系数、每个样本对聚类的重要性权重值,综合考虑各个样本的贡献度和各个特征的重要性,从而达到提高聚类结果质量的目的。使用5个来自UCI的标准机器学习数据集,对聚类算法的有效性进行验证。结果表明,对于具有不同样本贡献度和不同特征重要性的数据集,提出的算法具有较好的聚类效果。  相似文献   

2.
鉴于网络入侵检测数据样本特征属性的异构性及贡献率不同,提出一种加权特征的异构数据相似性度量法来反应网络数据样本间的相似程度.针对基于模糊C-均值聚类的网络入侵检测算法聚类数目难以确定的问题,提出了一种自动确定最佳聚类数的无监督模糊聚类入侵检测算法.通过KDDcup1999数据集的仿真对比实验,结果表明本文算法能找到最佳...  相似文献   

3.
当训练集中各个类别的样本分布不均匀且存在数据稀疏问题时,朴素贝叶斯算法分类不够准确。针对此问题,提出了一种基于数据平滑与加权补集的朴素贝叶斯文本分类算法,该算法引入数据平滑算法计算贝叶斯模型中缺失特征的补偿概率,克服数据稀疏问题;利用当前类别补集的特征来表示当前类别的特征,解决训练集中各个类别的样本分布不均匀时,分类器容易倾向于大类别而忽略小类别的问题。实验结果表明,在样本集分布不均衡时,该算法比传统的朴素贝叶斯分类算法分类效果更好。  相似文献   

4.
提出了一种基于二元结构特征提取的人脸识别算法. 该算法将所有类进行两两组合,以两类分类器为基础,为每个两两组合类间的识别挑选最适合分类的特征构成特征选取空间. 对未知样本进行测试时,在特征选取空间中计算测试样本与所有训练类的相似度,将未知样本判断为与之相似度最大的类. 运用AT&T和AR人脸数据库对该算法进行性能测试,与其他算法相比,该算法能在较小的特征维数下获得更高的识别率.  相似文献   

5.
One-against-all支持向量机的多标签分类存在将样本分类到训练集无法获取标签的"未定义"区域和没有明确决策函数的标签模糊区域的问题。对此提出一种基于模糊支持向量机的多标签分类改进方法(FSVMi)。该方法通过将多条决策边界合并,并为每个标签类分配相应的隶属函数。实验结果表明,相比于现有方法,该方法更具有优越性。  相似文献   

6.
以数据挖掘为工具,结合县域经济发展理论,探究湖南省县域经济发展聚集态势.构建了湖南省县域经济发展评价指标体系,对数据集应用基于原型的二分K均值聚类、基于图的AGNES聚类、加权主成分距离聚类与基于密度的DBSCAN聚类,根据邻近度矩阵的相关度选择最优聚类方法 .结果显示,湖南省县域经济发展按特征可归为四类,各类县市特征显著,类别间发展差距较大.根据模型的理论结果对现有的湖南省政府乡村振兴三大发展梯队的划分进行调整,为地方政府实施乡村振兴战略提供一定的理论基础,具有较好的参考价值.  相似文献   

7.
KNN算法通过近邻样本的个数分类,Entropy-KNN算法给出新的相似度定义,而且投票时综合待测样本与近邻样本的个数和各类近邻的平均距离,但两种算法均未考虑近邻样本间的相似.提出的基于层次聚类法的Entropy-KNN算法,首先对训练集按类别进行层次聚类,接着在与待测样本最相似的子类中选取近邻样本,使得近邻样本具有较高的相似度,最后结合Entropy-KNN算法进行分类.在蘑菇数据集上的实验结果表明,该算法的分类准确率高于Entropy-KNN算法.  相似文献   

8.
朴素贝叶斯分类是一种简单高效的方法.但是当属性独立性假设不成立时,有可能导致待测样本类别判断错误;且当待测样本到各类别的概率相同时,无法判断该样本类别,从而影响了它的分类准确率.本文提出基于属性值贡献率的朴素贝叶斯改进算法,利用待测样本的各个属性值在各类别的总贡献率判别该样本的类别.在蘑菇数据实验结果表明,该算法能有效提高分类的准确率.  相似文献   

9.
传统的基于PCA-HOG特征的行人头部分类算法存在降维后的子空间鉴别性不足的问题.为此,提出一种基于分步降维HOG-LBP特征的行人头部分类算法.首先,利用样本类别标签构建2类样本的HOG特征集合,在这2类特征集合中分别执行PCA降维,然后将所得的特征与LBP纹理特征进行级联得到最终的头部描述算子,最后通过训练SVM分类器对实际样本集进行分类.实验结果表明,与传统PCA降维方法相比,该方法可有效提高行人头部的分类性能.  相似文献   

10.
为实现对中断的航迹进行准确的关联识别,形成统一的海上态势,提出了基于航迹预测和模糊隶属度评价的航迹关联识别方法。采用多项式拟合方法进行航迹的双向推测,选取位置、航向、速度作为模糊因素集,采用岭型模糊隶属度函数计算预测的航迹点之间各模糊因素的隶属度并加权得到单时刻隶属度,构造加权函数计算综合隶属度,通过阈值门限判断两航迹是否关联。在仿真实验中,所提方法精确率大于90%,召回率大于80%,关联性能优于传统方法。为进一步研究该方法的场景适应性,仿真了不同场景下的船舶航迹雷达监测数据,包括中断区间内船舶运动稳定场景、速度变化场景、航向变化场景等,船舶运动状态稳定时关联结果的召回率大于90%,中断区间内速度变化小于8 km/h时召回率大于84%,航向变化低于25°时召回率大于88%。该方法为解决非合作船舶交叉环境下的中断航迹关联识别问题提供了有效途径。  相似文献   

11.
针对分类过程中噪声影响问题,提出了基于模糊支持向量的判别分析法。利用基于马氏距离的模糊c均值算法,对每个训练样本点赋予不同的隶属度。将模糊支持向量机与Fisher判别法相结合,达到降维去噪的目的。实验结果表明:提出的分类方法的错分率明显低于其他的方法,而且能减轻噪声对分类的不良影响,从而证明算法的有效性。  相似文献   

12.
提出了一种基于模糊C均值聚类分析以及主成分分析的无线电异常信号分类方法,该方法利用主成分分析对信号数据进行降维并通过模糊C均值对信号数据进行分类,对目前常用的通过专家经验进行信号特征选取的方法进行了改进.实验结果证明了该方法的有效性,能快速高效地判断异常信号的类别.  相似文献   

13.
利用高斯型隶属函数作为隐层神经元激励函数,构建了四层模糊前向神经网络.根据从训练数据集中提取出的插值样本数量来确定隐层神经元个数.网络结构确定后,基于二元函数逼近论确定最优权值,得到双输入型近似插值神经网络,说明了最优权值的双输入型模糊前向神经网络的实现过程.计算机数值仿真实验表明所构建的网络在运行时间、逼近精度与去噪效果等方面是有效的,丰富了多输入神经网络的构建方法.  相似文献   

14.
针对隶属度或非隶属度为零的直觉不确定语言数,已定义的直觉不确定语言基本运算存在不合理性,导致信息集结结果出现较大偏差.考虑直觉不确定语言数的隶属度与非隶属度之间可能存在的交叉影响,定义新的加法、数乘、乘法及幂乘运算,在此基础上给出直觉不确定语言加权交叉算术平均算子、有序算术平均算子及混合交叉算术平均算子,同时给出直觉不确定语言加权交叉几何平均算子、有序几何平均算子及混合几何平均算子.根据算子本身的特点给出考虑交叉影响的直觉不确定语言多属性群决策方法,并通过算例验证所给决策方法的有效性与可行性.  相似文献   

15.
根据隧道衬砌结构耐久性评估具有多指标多级别的特点,利用可变模糊综合评估方法确定隧道衬砌结构耐久性等级.以可变模糊集合与相对差异函数为基础的可变模糊综合评价模型可以科学地确定隧道衬砌结构评估指标,对于各级区间的相对隶属度和相对隶属函数,通过变化模型及其参数确定耐久性评估等级,并应用MATLAB将计算过程编写成程序.通过实测数据对兰州七道梁隧道衬砌结构进行健康状态分析,得出级别特征值为1.948,健康等级属于1A级,偏向于B级.与模糊综合评价方法进行对比,验证了模型的实用性,并将该模型应用于兰州北环路九州隧道衬砌结构耐久性评估.  相似文献   

16.
针对现有Web新闻文本分类方法准确率低且不能适应文本类型变化的问题,提出一种基于进化模糊规则的Web新闻文本挖掘和分类方法.首先,对每篇Web文本进行术语提取,并利用词频-逆向文档频率(TF-IDF)算法过滤掉一些具有较低描述能力的术语.然后,基于计算收集到的新的新闻文本内容与类别之间的余弦距离,利用eClass0分类器创建和更新模糊规则的数量和属性.最后,根据模糊规则推理和余弦距离进行文本分类.实验结果表明,该方法具有较高的正确分类率,且能够自适应Web新闻文本类别的变化.  相似文献   

17.
针对统计方法不能从语义理解的角度进行文本分类的问题,提出了利用概念层次网络概念知识进行文本分类的方法,包括两部分:依据概念进行特征选取以及根据类别关联度分类. 在特征选取时,通过计算概念与类别的区分度挖掘出类别核心概念,并采用类别核心概念对特征项进行精选. 依据类别核心概念相关的类别语义信息,提出了文档与类别关联度的计算方法,并根据类别关联度来判断文本类别. 实验表明,该方法可有效降低特征空间维数,在提高分类效率的同时保证了分类效果,F1值略有提高. 与SVM、KNN和Bayes分类器对比,当特征项数目较少时,该方法的F1值明显高于其他3种方法,综合分类效果与SVM相当,优于KNN和Bayes.  相似文献   

18.
集成学习是一种受到广泛认可和使用的机器学习算法.为此提出一种新的多类集成学习算法,即AdaBoost belief.此算法改进多类集成学习算法AdaBoost·SAMME,使每个基分类器对于每个类别都有权重信息.这种类别上的权重被称为类别信念,可通过计算每次迭代中各个类别的正确率得到.将所提出的算法与原有的AdaBoost·SAMME算法从预测准确率、泛化能力以及理论支持等方面进行比较发现:在高斯数据集、多种UCI数据集以及基于日志的多类别入侵检测应用中,该算法不但具有更高的预测准确率和泛化能力,而且当类别数目增加,即类别更难以预测时,其分类错误率较原有AdaBoost·SAMME算法上升得更缓慢.  相似文献   

19.
鉴于传统的评价方法仅考虑评价过程的模糊性而忽略随机性这一问题,研究基于熵权和正态云模型构建了一种针对大学生创新能力的评价方法,旨在解决传统评价方法无法同时兼顾评价过程的模糊性和随机性的问题。该评价方法在建立评价指标体系、确定指标评价的等级及对应云模型的数字特征值的基础上,对评价对象进行测评;依据测评结果分别运用熵权法、云模型计算指标的权重与隶属度矩阵;最后将权重矩阵与隶属度矩阵进行合成,计算得到评价对象的创新能力等级综合确定度,并依据最大隶属度原则确定样本隶属等级。研究结果表明:熵权-正态云模型在大学生创新能力评价中具有良好的实用性和可靠性,可为大学生创新能力评价提供一种新途径。  相似文献   

20.
提出基于分类器可信度的权重计算策略,解决动态数据流集成分类中子分类器权重分配难题.该方法充分考虑了所处不同位置样本对权重计算的影响,利用信息熵描述分类器对预测结果的不确定性,建立分类器可信度与样本之间的关系,进而给出分类器可信度的定量计算方法.最后结合动态数据流分类需求和概念漂移特点,借助批量学习和时间遗忘策略构建基于分类器可信度的动态加权集成分类模型.理论分析和实验结果表明该分类方案可行,相比传统集中方法具有一定的优势.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号