共查询到19条相似文献,搜索用时 968 毫秒
1.
针对SURF对图像局部特征具有极好的描述能力,但对于全局特征描述能力不强的缺点,提出将SURF和全局颜色特征相融合的图像分类算法,提取图像的SURF特征向量集,并利用随机直方图算法将该向量集进行数据归约成单一高维特征向量;提取图像HSV颜色直方图;分别利用支持向量机(SVM)对这两种特征进行分类;将两个分类结果进行高层特征融合得到最终分类结果。实验结果表明,该算法显著提高了图像分类的准确率。 相似文献
2.
针对传统的基于深度学习的遥感图像分类算法未能有效融合多种深度学习特征,且分类器性能欠佳的问题,提出一种改进的基于深度学习的高分辨率遥感图像分类算法。首先,设计并搭建一个七层卷积神经网络;其次,将高分辨率遥感图像样本输入到该网络中进行网络训练,得到最后两个全连接层输出作为遥感图像两种不同的高层特征;再次,针对该网络第五层池化层输出,采用主成分分析(PCA)进行降维,作为遥感图像的第三种高层特征;然后,将上述三种高层特征通过串联的形式进行融合,得到一种有效的基于深度学习的遥感图像特征;最后,设计了一种基于逻辑回归的遥感图像分类器,可以对遥感图像进行有效分类。与传统基于深度学习的遥感图像分类算法相比,所提算法分类准确率有较高提升。实验结果表明,该算法在分类准确率、误分类率和Kappa系数上表现优异,能实现良好的分类效果。 相似文献
3.
针对非对称局部二值模式(AR-LBP)提取的人脸特征有限,以及协同表示分类(CRC)人脸存在的类间干扰,提出以多层AR-LBP特征及联合韦伯局部描述子(WLD)特征进行补充,并以增加CRC中稀疏性来降低类间干扰。提取人脸图像的多层AR-LBP特征并级联,与从原图像提取的WLD特征级联得到多层AR-LBP与WLD融合特征,采用稀疏增强的协同表示分类(SA-CRC)完成人脸分类。在ORL、Yale和GT公开人脸库上,提出的多层AR-LBP与WLD特征融合算法与AR-LBP特征提取算法、WLD特征提取算法以及多层LBP与HOG特征融合算法相比,识别正确率提高了0.7%~42.6%;当利用SA-CRC取代CRC后,识别正确率进一步得到提高。 相似文献
4.
针对相位一致性特征对血管中心检测不足问题,提出基于融合相位特征的眼底视网膜血管分割算法。首先,预处理原始的视网膜图像;然后,对图像中每个像素构造4D的特征向量(包括Hessian矩阵、Gabor变换、条带选择组合位移滤波响应(B-COSFIRE)滤波、相位特征);最后,采用支持向量机(SVM)进行像素分类,实现眼底视网膜血管的分割。其中,相位特征是将分别提取的相位一致性特征与Hessian矩阵特征进行小波融合后得到的一种新的融合相位特征。该特征既保留了相位一致性特征良好的血管边缘信息,又克服了相位一致性特征对血管中心检测的不足。在用于血管提取的数字视网膜图像(DRIVE)数据库上测得基于融合相位特征的视网膜血管分割算法的平均准确率(Acc)为0.9574,平均受试者工作曲线面积(AUC)为0.9702;且在单一特征进行像素分类提取血管的实验中,与使用相位一致性特征相比,使用融合相位特征进行像素分类提取血管的Acc由0.9191提高到0.9478,AUC由0.9359提高到0.9578。实验结果表明,融合相位特征比相位一致性特征更适用于基于像素分类的眼底视网膜血管分割算法。 相似文献
5.
针对多数恶意代码分类研究都基于家族分类和恶意、良性代码分类,而种类分类比较少的问题,提出了多特征融合的恶意代码分类算法。采用纹理图和反汇编文件提取3组特征进行融合分类研究,首先使用源文件和反汇编文件提取灰度共生矩阵特征,由n-gram算法提取操作码序列;然后采用改进型信息增益(IG)算法提取操作码特征,其次将多组特征进行标准化处理后以随机森林(RF)为分类器进行学习;最后实现了基于多特征融合的随机森林分类器。通过对九类恶意代码进行学习和测试,所提算法取得了85%的准确度,相比单一特征下的随机森林、多特征下的多层感知器和Logistic回归算法分类器,准确率更高。 相似文献
6.
针对现有算法自动识别颈部淋巴结效率不高、存在大量假阳性且整体假阳性去除效果不理想的问题,提出一种基于级联全卷积神经网络(FCN)的颈部淋巴结识别算法。首先,结合医生的先验知识采用级联FCN进行初步识别,即第一个FCN从头颈部计算机断层扫描图像(CT)中提取淋巴结医学分区;然后,第二个FCN从分区内提取候选样本并在三维层面合并这些样本以生成三维图像块;最后,将提出的特征块平均池化引入到三维分类网络中,对输入的不同尺度三维图像块进行二分类以去除假阳性。在颈部淋巴结数据集中,采用级联FCN识别颈部淋巴结的召回率可达97.23%;引入特征块平均池化的三维分类网络的分类准确率可达到98.7%。在去除假阳性之后的准确率可达93.26%。实验结果分析表明,所提算法能有效实现颈部淋巴结的自动识别并取得较高的召回率和准确率,优于目前相关文献报道的算法;且算法简单高效,易于扩展到其他三维医学图像的目标检测任务中。 相似文献
7.
针对在传统机器学习方法下单幅图像深度估计效果差、深度值获取不准确的问题,提出了一种基于多孔卷积神经网络(ACNN)的深度估计模型。首先,利用卷积神经网络(CNN)逐层提取原始图像的特征图;其次,利用多孔卷积结构,将原始图像中的空间信息与提取到的底层图像特征相互融合,得到初始深度图;最后,将初始深度图送入条件随机场(CRF),联合图像的像素空间位置、灰度及其梯度信息对所得深度图进行优化处理,得到最终深度图。在客观数据集上完成了模型可用性验证及误差估计,实验结果表明,该算法获得了更低的误差值和更高的准确率,均方根误差(RMSE)比基于机器学习的算法平均降低了30.86%,而准确率比基于深度学习的算法提高了14.5%,所提算法在误差数据和视觉效果方面都有较大提升,表明该模型能够在图像深度估计中获得更好的效果。 相似文献
8.
9.
针对传统稀疏编码图像分类算法提取单一类型特征,忽略图像的空间结构信息,特征编码时无法充分利用特征拓扑结构信息的问题,提出了基于多尺度特征融合Hessian稀疏编码的图像分类算法(HSC)。首先,对图像进行空间金字塔多尺度划分;其次,在各个子空间层将方向梯度直方图(HOG)和尺度不变特征转换(SIFT)进行有效的融合;然后,为了充分利用特征的拓扑结构信息,在传统稀疏编码目标函数中引入二阶Hessian能量函数作为正则项;最后,利用支持向量机(SVM)进行分类。在Scene15数据集上的实验结果表明,HSC的准确率比局部约束线性编码(LLC)高了3~5个百分点,比支持区别性字典学习(SDDL)等对比方法高了1~3个百分点;在Caltech101数据集上的耗时实验结果表明,HSC的用时比多核学习稀疏编码(MKLSC)少40%左右。所提HSC可以有效提高图像分类准确率,算法的效率也优于对比算法。 相似文献
10.
为了充分利用图像信息以提高现有交通监控下车型分类的效果,在胶囊网络的基础上增加梯度直方图卷积(HOG-C)特征提取方法,提出HOG-C特征的胶囊网络模型——HOG-C CapsNet。首先,使用梯度统计特征提取层对图像中的梯度信息进行统计,构建方向梯度直方图(HOG)特征图;其次,使用卷积层提取出图像的颜色信息,把提取出的颜色信息与HOG特征图融合构成HOG-C特征图;最后,输入卷积层提取HOG-C特征图的抽象特征,并通过胶囊网络对提取的抽象特征进行具有三维空间特征表达的胶囊封装,使用动态路由算法实现车型分类。在BIT-Vehicle数据集上对该模型和其他相关模型进行的对比实验中,该模型得到98.17%的准确率、97.98%的平均精确率均值(MAP)、98.42%的平均召回率均值(MAR)和98.20%的综合评价指标。实验结果表明,该模型在交通监控下的车型分类上具有更好的效果。 相似文献
11.
12.
为解决生物启发模型(BIM)存在的3个问题,即高计算复杂度、有争议的视觉皮层关系建模,以及类前向反馈机制带来的盲目特征选择,提出一种基于生物启发特征(BIF)的真实环境笑脸分类方法。构建基于BIF的笑脸分类系统,提取人脸表情图像嘴部区域的金字塔梯度方向直方图特征,使用局部保持投影进行BIM特征降维,采用Adaboost算法进行BIM特征选择。实验结果验证,该系统的最佳识别率达96.5%。 相似文献
13.
为有效解决旋转变化、光照变化和尺度变化等图像的分类问题,提出一种基于多尺度局部二元模式(LBP)金字塔特征的图像分类算法。通过多尺度LBP金字塔提取各尺度的图像纹理特征,建立图像的多尺度LBP金字塔直方图,并将其作为图像特征向量,采用K-means方法对该特征向量进行降维,以用于图像分类。同时,针对传统二进制权值分布方法对噪声敏感的缺点,提出一种多端权值分布方法。实验结果表明,多尺度LBP金字塔方法具有较好的可鉴别性及图像描述能力,而多端权值分布法也能提高图像的分类精度。 相似文献
14.
提出了一种基于局部二元模式(Local Binary Pattern,LBP)与支持向量机(SVM)相结合的面部表情识别方法。使用LBP算子对图像进行处理,对图像的模式进行统计形成面部表情特征;使用线性判别分析对表情特征进行降维处理;采用支持向量机对面部表情进行分类。用Matlab实现了上述方法,并在日本女性人脸表情(JAFFE)数据库上测试,取得了70.95%的识别率。 相似文献
15.
传统的局部敏感鉴别分析方法未考虑原有图像样本像素关系信息,识别效果受到影响。为此,提出一种光滑局部敏感鉴别分析方法。针对图像样本构造一个基于离散拉谱拉斯图的正则化项,该正则化项包含图像像素关系的先验信息,并将其嵌入到局部敏感鉴别分析的目标函数中,使抽取的特征具有空间光滑的特性,从而增强局部敏感鉴别分析算法的泛化能力。在ORL和IMDB人脸数据集上的实验结果证明了该方法的有效性。 相似文献
16.
17.
低层特征的选择与提取是自动图像分类的基础,一方面,所选择的图像特征应能代表各种不同的图像属性,利于不同类别图像之间的区分;另一方面,为了提高后续模型的计算效率,需要减少噪声特征、冗余特征.提出了一种基于特征加权的自动图像分类方法.该方法根据图像低层特征分布的离散程度来衡量特征相对于类别的重要性,增加相关度高的特征的权重,降低相关度低的特征权重,从而避免后续模型被弱相关或不相关的特征所支配.所提的特征加权算法主要考察的是特征相对某个具体类别的重要程度,可以为每个类别选择出适合自身的特征权重.然后,将加权特征嵌入到支持向量机算法中用于自动图像分类,在Corel图像数据集上的实验结果表明,基于特征加权的自动图像分类算法可以有效地提高图像分类的准确性. 相似文献
18.
针对现有的纹理特征提取方法计算复杂度高的问题,利用局部二值模式(LBP)算法思想简单、计算复杂度小的优势,在已有的完整LBP(CLBP)算法基础上,提出了一种改进的CLBP算法(ICLBP)。ICLBP算法保留了CLBP算法中CLBP_S,而对CLBP_M算子、CLBP_C算子进行了改进,提出一个新的纹理描述算子ICLBP_T。ICLBP算法更全面地描述了局部窗口的纹理特征,同时有效解决了CLBP算法中CLBP_M算子对灰度分布不均敏感的问题。通过对Outex、CURet数据库的数据分类实验,结果表明,相比于已有的LBP算法,ICLBP算法的分类精度有了明显的改进,同时ICLBP算法中ICLBP_SCT特征具有较低的特征维数,具有较好的实用价值。 相似文献
19.
重音是语言交流中不可或缺的部分,在语言交流中扮演着非常重要的角色。为了验证基于听觉模型的短时谱特征集在汉语重音检测方法中的应用效果,使用MFCC(Mel frequency cepstrum coefficient)和RASTA-PLP(relative spectra perceptual linear prediction)算法提取每个语音段的短时谱信息,分别构建了基于MFCC算法的短时谱特征集和基于RASTA-PLP算法的短时谱特征集;选用NaiveBayes分类器对这两类特征集进行建模,把具有最大后验概率的类作为该对象所属的类,这种分类方法充分利用了当前语音段的相关语音特性;基于MFCC的短时谱特征集和基于RASTA-PLP的短时谱特征集在ASCCD(annotated speech corpus of Chi-nese discourse)上能够分别得到82.1%和80.8%的汉语重音检测正确率。实验结果证明,基于 MFCC的短时谱特征和基于RASTA-PLP的短时谱特征能用于汉语重音检测研究。 相似文献