首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 453 毫秒
1.
考虑因子数据的数据特征,采用连续属性服从正态分布的朴素贝叶斯分类方法,对因子分析降维前后数据集的分类性能变化进行了研究.实验结果表明:因子分析中的KMO(Kaiser—Meyer—Olkin)统计值和变量共同度与分类性能紧密相关,当KMO统计值大于0.8,并且只有很少属性的变量共同度值小于80%时,采用因子分析作为分类之前的降维是适宜的.  相似文献   

2.
比较了犯罪嫌疑人脸部识别中常用的数据降维和模式分类方法.数据降维方法包括主分量分析和线性判别分析等子空间降维方法,模式分类方法包括近邻法和支持向量机等分类方法,并基于ORL人脸数据库进行了仿真实验,同时比较了各算法在该数据集上的性能.结果表明,主分量分析和改进的线性判别分析算法性能相差不大,后者的性能比经典的线性判别分析好很多;支持向量机的性能比最近邻好,采用不同核的支持向量机之间的性能相差不大.  相似文献   

3.
针对信用风险评级过程中数据的高维性和各属性数据存在量纲差异性的问题,提出了一种基于邻域粗糙集和距离判别的信用风险评级方法。邻域粗糙集是一种常用的降维方法,与传统的降维方法相比有严格的数学推导,对数值型属性和类别型属性可作分别处理。数值型属性在距离判别时容易受到数据量纲的影响,采用马氏距离可以消除数据量纲差异对分类造成的影响。因此以待测样本与各类训练总体之间的马氏距离的大小作为判据对待测样本进行分类。对现实数据进行实验,各类和总体的数据准确率表明该方法是一种有效的评级方法。  相似文献   

4.
传统的判别分析方法只适用于维数较低的情况,当样本数据为高维和超高维时,需要先对数据进行变量的特征筛选,再利用传统方法进行判别分类.使用R软件,利用M-V方法对巴西某公司所有的9类文案进行降维,找出分类标准,并对未来不同文案的分类进行预测.最终确定逐步判别法对降维后的文案分类效果好,预测效果也不错.  相似文献   

5.
基于LS-SVM与模糊补准则的特征选择方法   总被引:3,自引:3,他引:0  
针对传统特征选择算法采用单一度量的方式难以兼顾泛化性能和降维性能的不足,提出新的特征选择算法(least squares support vector machines and fuzzy supplementary criterion, LS-SVM-FSC)。通过核化的最小二乘支持向量机(least squares support vector machines, LS-SVM)对每个特征的样本进行分类,使用新的模糊隶属度函数获得每个样本对其所属类的模糊隶属度,使用模糊补准则选择具有最小冗余最大相关的特征子集。试验表明:与其他10个特征选择方法与7个隶属度决定方法相比,所提算法在9个数据集上都具有很高的分类准确率和很强的降维性能,且在高维数据集中的学习速度依然很快。  相似文献   

6.
针对入侵检测系统产生的高维数据的处理问题,提出基于GA与BP神经网络的入侵检测组合模型进行特征选择。为了优化入侵检测分类算法,利用遗传算法适合复杂系统优化的特点,去除入侵检测数据多维特征属性中的冗余部分,将入侵检测数据特征属性对应到染色体,BP神经网络的分类准确率作为种群个体的适应度值,通过遗传算法的全局搜索能力,找出对分类算法最有影响的特征属性组合,从而达到降维的目的。采用KDD99数据集进行分析,实验表明,经过组合算法特征选择的数据能在分类正确率、运算时间、运算稳定性等方面取得更优的效果。  相似文献   

7.
基于偏最小二乘降维的分类模型比较   总被引:1,自引:0,他引:1  
在众多数据降维方法中,偏最小二乘降维方法是一种非常有效的数据降维模型,并被广泛应用于生物基因数据分析等领域。但基于偏最小二乘降维的分类模型的选择问题,往往为以往的研究工作所忽视,研究者基本是根据自身喜好选择不同的分类模型。针对这一问题,本文通过大量的实验,对多种不同分类模型在生物基因芯片数据集上的性能进行了比较和分析。通过t检验,发现人工神经网络、逻辑斯特判别、线性支持向量机是3种在偏最小二乘降维上性能较好的的分类模型。  相似文献   

8.
运用因子分析的降维整合功能对高职教育的投入和产出指标分别进行降维处理以消除这些指标之间的强线性关系,得到新的投入产出指标体系。在该指标体系基础上进行数据包络分析(DEA)计算,结果显示,因子分析处理前后的DEA效率值和效率排行都出现了明显区别,该方法为高职院校效率评价的指标体系构建提供了重要借鉴。  相似文献   

9.
针对经典极限学习机中输入权值随机初始化容易导致输出稳定性不够好进而影响分类性能的问题,提出外类入侵度初始化参数的方法,对极限学习机随机初始化的输入权值用样本的属性特征信息进行修正.该方法对包含两个类别样本的数据集,将其中一个类作为本类,另一个类作为外类.对于每个特征,统计本类和外类样本重叠的区域占本类取值范围的比例,也统计重叠区域中外类样本数目占重叠区域总样本数目的比例.然后依据这两种占比值计算每个特征的外类入侵度.再根据入侵度大小调整极限学习机模型中隐含层的输入权值.在10个UCI数据集上进行的分类实验结果表明,新方法的准确率比经典极限学习机提高了1%~23%,且泛化性能更稳定;与另外两方法相比,新方法的准确率稍高.  相似文献   

10.
采用李克特量表设计问卷等方式进行问卷发放数据收集,分析问卷结果,得出电信运营商忠诚度的影响因素,运用SPSS18.0软件对收集的数据进行信度效度检验、因子分析,通过方差最大化旋转,对影响因素进行降维,得出电信运营商社会渠道忠诚度的主要影响因素是品牌价值、产品属性、运营商承诺、情感付出等。  相似文献   

11.
提出了一种新型网络入侵检测分类模型,设计了一个基于支持向量机(SVM)的分类器。采用因子分析法(FA)将行为样本的众多相关网络特征融合成精简的综合特征,实现了对网络监测数据的降维。利用支持向量决策函数排序法(SVDFRM),通过支持决策向量函数得到网络行为的特征贡献率并提取网络行为的重要特征。KDD99数据集测试实验结果表明,提出的分类模型降维效果显著,具有较好的实时性和较高的检测率。  相似文献   

12.
为获取连续属性值数据集的最小属性子集,提出了一种两步约简方法.该方法以模糊粗糙集模型为基础,将描述条件属性和决策属性依赖关系的模糊依赖度概念进行了扩展,使其能对条件属性之间的依赖关系进行度量,利用属性与类别之间的依赖度选出候选属性集,然后根据单个属性与类别和属性之间的依赖度对候选属性集进行约简.仿真结果表明,该方法在有效降低属性维数的同时一定程度上保证了分类正确率.  相似文献   

13.
SVM和RVM对高光谱图像分类的应用潜能分析   总被引:1,自引:0,他引:1  
针对高光谱图像分类一直面临的小样本、非线性及高维数等问题,分别从原理和实验两个方面分析比较了两种最新的核学习方法——支持向量机(SVM)和相关向量机(RVM)在高光谱图像分类中的异同点.通过对稀疏性、运算时间及分类精度的实验仿真,结果表明:与SVM相比,RVM模型更加稀疏,从而测试时间更短,更有利于大数据量在线测试;然而,RVM的缺点是分类精度略低于SVM.基于此,本文利用Fisher线性鉴别分析(FLDA)技术,在分类前对高光谱数据作可分性预处理,一方面可以降低数据维数、减少计算量,另一方面可以有效地提高小样本区域的分类精度,进而提高RVM的总体分类精度,使得RVM与SVM相比在高光谱图像精细分类方面更具优势.  相似文献   

14.
针对高光谱图像分类一直面临的小样本、非线性及高维数等问题,分别从原理和实验两个方面分析比较了两种最新的核学习方法——支持向量机(SVM)和相关向量机(RVM)在高光谱图像分类中的异同点.通过对稀疏性、运算时间及分类精度的实验仿真,结果表明:与SVM相比,RVM模型更加稀疏,从而测试时间更短,更有利于大数据量在线测试;然而,RVM的缺点是分类精度略低于SVM.基于此,本文利用Fisher线性鉴别分析(FLDA)技术,在分类前对高光谱数据作可分性预处理,一方面可以降低数据维数、减少计算量,另一方面可以有效地提高小样本区域的分类精度,进而提高RVM的总体分类精度,使得RVM与SVM相比在高光谱图像精细分类方面更具优势.  相似文献   

15.
高维数据正定核与不定核的KPCA变换阵比较   总被引:1,自引:1,他引:0  
两步降维的核主成份分析(kernel principal component analysis,KPCA)+线性判别式分析(linear discriminant analysis,LDA)法中,第一步KPCA变换阵的选取影响数据的分类结果。对线性不可分问题首先研究了正定核KPCA+LDA中KPCA变换阵的选取对分类结果的影响;其次,将正定核推广到不定核,研究了不定核KPCA+LDA中KPCA变换阵的选取对分类结果的影响;最后通过实验加以分析和验证。  相似文献   

16.
提出的仿射投影算法可根据输入数据矩阵条件数的变化情况,实时地决定下一步输入矩阵的维数,即数据重用因子和步长,并利用这两个动态量去折中收敛速度和稳态误差之间的矛盾.仿真结果表明,在较大程度节省了运算量的情况下,该算法的收敛速度接近于使用高维输入矩阵的情况,而稳态误差与使用低维输入矩阵时相当,同时收敛稳定性更优.  相似文献   

17.
在已有P2P模型的基础上,提出了一种基于时间序列最近偏向技术的网络信任模型(recent-biased trust model,RBTM)。该模型采用了时间序列可变分割法选取评价时间单元(evaluate time unit,ETU),同时引入了比较合理的时间衰减因子,并对新数据的加入做了详尽的描述;根据节点交易的历史时间信息、内容相似度和反馈评价值自适应动态地调整节点的推荐值;实例表明,该模型具有良好的扩展性和较低的运行开销。  相似文献   

18.
SVM算法复杂度与样本维数无关,具有的泛化能力强、分类精度高的特点,而LLE是有效的非线性降维方法,本文利用支持向量机(SVM)算法对局域线性嵌入(LLE)算法进行改进,有效地解决了基于内容的图像检索中的高维特征向量的降维问题,实验表明具有较高的查全率和查准率。  相似文献   

19.
针对支持向量分类机在病例诊断中,训练样本大、诊断速度慢的不足,根据粗糙集理论的属性约简和支持向量机的分类机理,提出了一种混合分类算法,对病例进行诊断.应用粗糙集理论在不损失有效信息的情况下对属性进行预处理,从决策表中删除冗余的属性和冲突对象,降低支持向量机的维数和分类过程中的复杂度.然后利用支持向量机的分类机原理,对对象进行分类和预测,从而达到对病例进行诊断.实验证明在通过粗糙集对信息约简后,在合理降低准确率的情况下提高了诊断速度,从而解决了支持向量分类机在处理大量病例信息情况下,诊断速度慢的问题.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号