首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 281 毫秒
1.
基于向量空间模型的文本分类中特征向量是极度稀疏的高维向量,只有降低向量空间维数才能提高分类效率。在利用统计方法选择文本分类特征降低特征空间维数的基础上,采用隐含语义分析技术,挖掘文档特征间的语义信息,利用矩阵奇异值分解理论进一步降低了特征空间维数。实验结果表明分类结果宏平均F1约提高了5%,验证了该方法的有效性。  相似文献   

2.
《微型机与应用》2015,(21):81-84
在文本分类中,特征空间维数可以达到数万维。使用信息度量的方法,如文档频率、信息增益、互信息等,对特征进行选择后的维数通常还是很大,降低阈值或减小最小特征数可能会降低分类效果。针对这个问题,提出基于粗糙集的二次属性约简。实验表明,该方法在有效降低特征维数的同时保证了分类效果。  相似文献   

3.
为解决图像隐密检测中图像特征维数过高导致的"维数灾难"问题,在保持图像特征内在低维结构的基础上降低特征向量的维数,方便构造更有效的分类器,提出了一种基于保局投影(locality preserving projections,LPP)降维的图像隐密检测算法,对待测图像进行小波变换形成图像特征后,利用LPP算法实现对图像高维特征的降维,得到图像特征集的低维流形.使用支持向量机(SVM)算法将降维后的特征映射到分类特征空间,实现对正常图像和隐密图像分类.实验结果表明,与不使用降维算法的检测方案相比,基于LPP降维的检测算法能够显著地提高检测的准确率.  相似文献   

4.
为了有效地解决传统的基于向量表示的文档维数降维算法存在的维数灾难和奇异值问题,提出了基于张量最大间隔投影的Web文档分类算法,该算法能够在维数降维的过程中充分利用文档的结构和关联信息来提高算法的分类鉴别能力,在WebKB和20NG数据集上的实验结果表明该算法优于其他常用的的文档分类算法。  相似文献   

5.
借鉴已有的特征选取方法和粗糙集相关理论,本文提出了一种改进的基于粗糙集理论的特征选择方法,其主要思想是通过构造粒度函数将其应用于特征在分类中的重要性度量和约简,最后通过实验验证了该方法是有效的,并能够显著降低文本特征维数,提高分类的效率和精度。  相似文献   

6.
基于粗糙集和灰色关联度的综合性特征选择   总被引:2,自引:1,他引:1       下载免费PDF全文
在文本特征空间中,特征维数通常高达几万,这大大限制了分类算法的选择,降低了分类算法的性能,影响了分类器的设计,为此需要进行特征选择以避免“维数灾难”。提出了一个综合性的特征选择方法,该方法首先利用一个优化的文档频进行特征初选以过滤掉一些词条来降低特征空间的稀疏性,然后利用一个基于粗糙集和灰色关联度的属性约简算法来消除冗余,从而获得较具代表性的特征子集。实验结果表明该综合性方法效果良好。  相似文献   

7.
基于自动子空间划分的高光谱数据特征提取   总被引:7,自引:0,他引:7  
针对遥感高光谱图像数据量大、维数高的特点,提出了一种自动子空间划分方法用于高光谱图像数据量减小处理。该方法主要包括3个处理步骤:数据空间划分,子空间主成分分析和基于类别可分性准则的特征选择。该方法充分利用了高光谱图像各波段数据之间的局部相关性,将整个数据划分为若干个具有较强相关性的独立子空间,然后在子空间内利用主成分分析进行特征提取,根据各类地物间的类别可分性选择有效特征,最后利用地物分类来验证该方法的有效性。实验结果表明,该方法能够有效地实现高光谱图像数据维数减小和特征提取,同现有的自适应子空间分解方法和分段主成分变换方法相比,该方法所提取的特征用于分类时能获得较好的分类精度。利用该方法进行处理,当高光谱数据维数降低了90%时,9类地物分类实验的总体分类精度可以达到80.2%。  相似文献   

8.
为了降低人脸表情识别过程中特征分类的计算量,采用了一种基于特征融合降维的表情识别算法。该算法首先对表情图像进行预处理,再利用Gabor小波多尺度多方向的特性对图像进行滤波,针对同一尺度下8个不同方向的几幅特征图像,对其中特征值最大的图像编码作为新特征图像的像素值,此时特征图像的维数降为原来的1/8。最后利用统计直方图对融合后的特征图像进行分块特征统计,将统计信息作为最终的特征信息进行分类。实验结果表明,该方法在保证人脸表情识别率的前提下减少了特征图像的计算量,提高了系统效率。  相似文献   

9.
针对传统的特征选择使用阈值过滤导致有效信息丢失的问题,提出一种粗糙集的文本特征选择方法。该方法以核为起点利用特征属性的重要性和依赖性作为启发式信息进行特征选择,使文本的特征维数得到一定程度的降低。实验表明,此算法不仅易于实现而且能够有效降低特征数目,提高分类效率。  相似文献   

10.
针对高维输入数据维数较大时可能存在奇异值问题,同时为提高算法的运算效率以及算法的鲁棒性,提出了一种基于L1范数的分块二维局部保持投影算法B2DLPP-L1。传统的局部保持投影算法为避免出现奇异值问题,首先运用主成分分析算法将高维数据投影到子空间中,然而这种方式将会造成高维数据中部分有效信息的流失,B2DLPP-L1算法选择将二维数据直接作为输入数据,避免运用向量形式的输入数据时可能造成的数据流失;同时该算法对二维输入数据进行分块处理,将分块后的数据块作为新的输入数据,之后运用基于L1范数的二维局部保持投影算法对其进行降维。理论上,B2DLPP-L1算法能够较好地对数据进行降维,不仅能够保持高维数据中的有效信息,降低计算复杂程度,提高算法的运行效率,同时还能够克服存在外点情况下分类准确率较低问题,提高算法的鲁棒性。通过选择不同的人脸数据库进行实验,实验结果表明,在存在外点的情况下,运用最近邻分类器时能够取得更高的分类准确率,同时所需的分类时间有所减少。  相似文献   

11.
目的 典型相关分析是一种经典的多视图学习方法。为了提高投影方向的判别性能,现有典型相关分析方法通常采用引入样本标签信息的策略。然而,获取样本的标签信息需要付出大量的人力与物力,为此,提出了一种联合标签预测与判别投影学习的半监督典型相关分析算法。方法 将标签预测与模型构建相融合,具体地说,将标签预测融入典型相关分析框架中,利用联合学习框架学得的标签矩阵更新投影方向,进而学得的投影方向又重新更新标签矩阵。标签预测与投影方向的学习过程相互依赖、交替更新,预测标签不断地接近其真实标签,有利于学得最优的投影方向。结果 本文方法在AR、Extended Yale B、Multi-PIE和ORL这4个人脸数据集上分别进行实验。特征维度为20时,在AR、Extended Yale B、Multi-PIE和ORL人脸数据集上分别取得87%、55%、83%和85%识别率。取训练样本中每人2(3,4,5)幅人脸图像为监督样本,提出的方法识别率在4个人脸数据集上均高于其他方法。训练样本中每人5幅人脸图像为监督样本,在AR、Extended Yale B、Multi-PIE和ORL人脸数据集上分别取得94.67%、68%、83%和85%识别率。实验结果表明在训练样本标签信息较少情况下以及特征降维后的维数较低的情况下,联合学习模型使得降维后的数据最大限度地保存更加有效的信息,得到较好的识别结果。结论 本文提出的联合学习方法提高了学习的投影方向的判别性能,能够有效地处理少量的有标签样本和大量的无标签样本的情况以及解决两步学习策略的缺陷。  相似文献   

12.
垃圾邮件过滤具有处理规模巨大,数据无限递增、动态变化等流数据特征,传统的垃圾邮件过滤方法利用静态的文本特征提取方法,无法体现流数据特征随时间动态变化的特点。该文提出一种基于时间流特性来实时调整有效特征的垃圾邮件过滤方法,在TREC Spam Track语料集上的测试结果表明,该方法在保证垃圾邮件过滤高准确率的同时,使垃圾邮件过滤计算的时间性能和空间性能更加优化。
  相似文献   

13.
胡浩慧  倪蓉蓉  赵耀 《软件学报》2018,29(4):1002-1016
针对可用于图像篡改的内容感知缩放技术,本文提出了一种基于概率Map图统计特征的内容感知缩放检测算法.该算法利用概率Map图来反映图像是否经过内容感知缩放操作,并利用新提出的积分投影与局部统计特征来检测篡改图像.而后利用分类器进行分类训练,从而有效识别基于内容感知缩放操作的图像篡改.实验结果显示,所提算法能够区分出原始图像与篡改图像,并具有较高的正确检测率.  相似文献   

14.
针对图像处理(如OCR技术)对图像方向要求十分严格,文本图像方向具有不确定性的问题,提出了中文文本图像倒置快速检测算法.利用投影技术定位出文本字符,结合中文字符及标点符号结构特征,筛选出文本图像中的标点符号,根据标点符号像素分布特点判断出类型,结合标点符号的使用习惯,采用统计的方法判断中文文本图像是否倒置.实验结果表明,投影方法可以不用基于内容达到高效快速的要求,利用统计方法可以保证判别率,该方法可用于OCR预处理过程.  相似文献   

15.
In this paper, we propose a novel feature selection method which can suppress the input features during the process of model construction automatically. The main idea is to obtain better performance and sparse solutions by introducing Tikhonov regularization terms and measuring the objective function with \(L_1 \)-norm, based on projection twin support vector machine. Furthermore, to make the problem easy to solve, the exterior penalty theory is adopted to convert the original problem into an unconstrained problem. In contrast with twin support vector machine which needs solve two QPPs, our method only solves two linear equations by using a fast generalized Newton algorithm. In order to improve performance, a recursive algorithm is proposed to generate multiple projection axes for each class. To disclose the feasibility and effectiveness of our method, we conduct some experiments on UCI and Binary Alpha-digits data sets.  相似文献   

16.
基于混合投影函数的眼睛定位   总被引:50,自引:0,他引:50  
耿新  周志华  陈世福 《软件学报》2003,14(8):1394-1400
介绍一种精确定位眼睛的方法.眼睛定位是很多人脸检测算法的关键步骤.在获得眼睛窗口之后,可以利用投影方法来定位眼睛.提出一种混合投影函数,该函数结合了积分投影函数和方差投影函数,能够反映出图像在某个方向上灰度均值和方差的综合变化情况.实验结果表明,利用混合投影函数可以相当精确地确定眼睛中心的位置.  相似文献   

17.
In digital multi-focal images (DMIs), morphological and topological information for a transparent specimen can be captured in the form of a stack of high-quality images. We propose to use projection methods such as coefficient of variation projection to exploit the entire information of a given DMI stack using its projection images from different directions. Besides, multiple features extracted from the projection images along different directions are combined by using canonical correlation analysis. Because DMI stacks represent the effect of different factors—texture, the directions of projection, different instances within the same class and different classes of objects, we embed the projection method within a multi-linear analysis framework to propose a multiple direction projection-based multi-linear classification approach. The experimental results on the nematode data show that our proposed classifier can achieve very reliable recognition rate (98.5%) on a real-life database, even we only use the texture feature instead of the combination of texture and shape features as in a previous work.  相似文献   

18.
徐正光  申思 《计算机工程》2007,33(18):214-216
结合人耳图像特点和两种整体统计特征提取方法的优缺点,该文用主成分分析(PCA)方法提取图像的表示信息特征,用压缩后的类平均向量中的判别信息获得先验类别特征并根据特征分量的类间类内方差比准则将两种特征交叉融合成新的特征向量。分别在2个不同的人耳图像库中进行识别实验,结果表明,该文提出的交叉融合特征识别方法比传统的PCA和PCA+LDA方法的正确识别率高,而且在有一定程度的光照变化和一定角度变化的情况下仍可获得很好的识别效果。  相似文献   

19.
提出了一种自适应性的特征提取方法。首先通过主成分分析求出样本全局投影空 间,然后基于最大化投影构建优化目标函数,最后通过该函数求出自适应于个体样本的投影空 间。该方法很好地考虑了样本集合中每个样本的分布特点。为了使得算法可应用于识别分类问 题中,给出了计算存在于不同投影空间的个体样本间相似性的方法,相比于欧式度量,该方法 被证明得到的相似性能够更好地表征样本间的测地距离关系,使其能够有效地对流型结构数据 进行学习。通过在不同数据库上进行分类及重构的对比实验,实验结果表明,该方法能够更好 地提取数据特征,且对离群点具有鲁棒性。  相似文献   

20.
针对传统克隆选择算法的不足,提出了一个基于球面杂交的新型克隆选择算法。在该算法的每次迭代过程中,动态地计算出每个抗体的变异概率,根据抗体的亲和度将抗体种群动态分为记忆单元和一般抗体单元,并以球面杂交方式对种群进行调整,从而加快了算法的全局搜索速度。实例验证了所提算法的有效性、可行性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号