首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 343 毫秒
1.
利用汉明距离优选神经网络学习样本   总被引:1,自引:0,他引:1  
鉴于学习样本对神经网络模型的模式识别性能有很大的影响 ,提出学习样本的选择应与识别模型所利用的特性相结合 ,并利用汉明 (Hamming)距离对用于旋转不变识别的级联模型的学习样本进行优选 ,计算机对三个很相似的飞机模型进行识别 ,识别结果表明对学习样本进行有效的选择不仅可以减少系统的学习训练时间而且可以提高模型的识别能力。  相似文献   

2.
基于高光谱成像和判别分析的黄瓜病害识别   总被引:3,自引:0,他引:3  
利用光谱成像技术(400~720 nm)识别黄瓜白粉病、角斑病、霜霉病、褐斑病和无病区域。构建高光谱图像采集系统进行样本图像的采集,预处理和光谱信息的提取。由于获得的原始光谱数据量很大,为了减少后续运算量,提高准确率,采用逐步判别分析和典型判别分析两种方法进行降维。逐步判别从55个波段中选择12个波段,典型判别从55个波段中提取2个典型变量。利用选择的光谱特征参数建立病害识别模型。逐步判别构建的模型对训练样本和测试样本的判别准确率分别为100%和94%,典型判别构建的模型对训练样本和测试样本的判别准确率均为100%。说明利用高光谱成像技术可以进行黄瓜病害的快速、准确识别,并为实现可见光谱范围内黄瓜病害的田间实时在线检测提供了可能。  相似文献   

3.
行人重识别的精确度主要取决于行人的特征描述,基于卷积神经网络的方法具有强大的特征表达能力,可以取得很好的行人重识别效果,但该方法对样本的监督信息利用不充分,且容易过拟合。针对这些问题,提出了一种卷积神经网络判别特征学习的模型,通过加强对样本监督信息的利用和提升对样本间距离关系的约束,使网络得到判别性强的特征。首先,利用批量内样本之间的距离关系来构造难分负样本对,并通过构造的难分负样本对和引入距离门限来改进对比损失函数,充分利用了样本的相似性信息并有效地防止了网络过拟合。其次,通过结合分类模型和验证模型,使批量内样本的所有监督信息都得到了充分利用。在Market1501、DukeMTMC-reID数据库上对所提算法的有效性进行了实验验证,结果表明,所提模型得到的特征具有更强的判别性,而且所提算法的平均识别精确率优于大多数先进算法。  相似文献   

4.
深度学习输入特征的选择直接影响其分类性能,为了进一步提高基于深度学习的鸟类物种识别模型的分类性能,该文提出一种多特征融合识别方法。该方法首先通过短时傅里叶变换、梅尔倒谱变换和线性调频小波变换分别计算得到鸣声信号的3种语图样本集,然后分别利用3种语图样本集训练3个基于VGG16迁移的单一特征模型,将3个模型的输出进行自适应加权求和实现融合,并修正了加权交叉熵函数以克服样本不平衡的问题,最后对语图进行分类实现鸟类物种的识别。以ICML4B鸣声库的35种鸟类为研究对象,对比了4种模型的平均识别准确率(MAP),结果表明特征融合模型较单一特征模型的MAP最大提高了0.307;选择输入语图的持续时间分别为100 ms、300 ms以及500 ms,对比不同持续时间下4种模型的测试MAP值,结果表明持续时间为300 ms时4种模型的MAP值均为最高;对比了不同信噪比下4种模型的识别效果,多特征融合模型的识别准确率随着信噪比的下降降低最少。说明在选择合适的语图持续时间后,该文提出的特征融合模型能得到更高的识别准确率,具有一定的抗噪能力,且训练参数少,更适合于少样本鸟类的识别。  相似文献   

5.
赵擎华  杨俊杰 《应用声学》2021,40(6):937-945
为解决司法话者识别中利用鼻化元音构建元音声学空间图时如何准确判别鼻化元音的口、鼻音共振峰的问题。本文通过计算机语音工作站对语音样本的共振峰进行编辑操作,利用生成的语音样本构建不同的对照组分别进行听辨。结果表明,口音、鼻音共振峰分别被衰减后的语音变化特点呈现一定规律,使用此方法可以准确区分鼻化元音的口、鼻共振峰的阶次。本文建立的“共振峰编辑”与“听觉感知”相结合的判别方法,可以为司法话者识别及语音感知、识别等相关领域通过构建元音声学空间图进行声学特征研究的模型提供口音、鼻音共振峰的判别依据。  相似文献   

6.
马宗方  程咏梅  潘泉  王慧琴 《光子学报》2014,40(8):1220-1224
常用的图像型火焰探测算法是提取火焰在图像上表现出的单个特征信息或其有效组合作为识别的依据,需要大量的训练样本进行学习与参量优化,且识别率对特征选择的要求也很高.本文从火焰的整体特征考虑,提出了基于颜色模型和稀疏表示模型相结合的图像型火灾探测方法.首先在HIS空间建立颜色模型对火灾图像进行预处理提取出疑似区域,建立稀疏表示模型,并利用主成分分析方法构造火焰和疑似火焰物体的特征字典,最后利用l1-minimization计算测试样本与训练样本的最小逼近残差实现火焰和干扰物体的分类识别.实验结果表明,该方法提高了火灾图像的分类准确度和识别速度,同时具有较高的准确率.  相似文献   

7.
基于可见光光谱分析的黄瓜白粉病识别研究   总被引:1,自引:0,他引:1  
白粉病是黄瓜常见病害之一,传播速度极快,严重时可造成黄瓜大量减产,对其进行快速准确识别,对黄瓜白粉病诊断和防治具有重要意义,应用可见光谱技术,结合主成分分析和支持向量机算法,实现对黄瓜白粉病的快速识别。配制白粉病菌孢子悬浮液,并人工接种于科研温室内的黄瓜叶片上,以诱发黄瓜白粉病,待白粉病有一定面积暴发后,利用海洋光学USB2000+型便携式光谱仪对黄瓜叶片光谱信息进行采集,利用五点取样法采集样本,在5个检查点,每点选取2株黄瓜进行调查,每株选取4枚感病叶片,每枚叶片随机选取5个感病区域进行光谱采集,共计采集200个感病叶片光谱样本,同样采集200个健康叶片样本作为对照。通过Ocean Optics Spectra-Suite软件采集漫反射标准白板信息和光谱仪暗电流实现光谱仪校正,调节积分时间、扫描次数以及平滑度等参数来实现光谱曲线平滑处理,以有效抑制光谱噪声,对光谱特征进行分类识别,去掉首尾噪声较大的波段,保留光谱的可见光波段进行研究,最终选取450~780 nm波段范围作为研究对象。利用主成分分析对所研究波段范围内的高维光谱数据(947维)进行降维处理,根据主成分的累计贡献率,选取前5个主成分作为分类模型的输入,以白粉病和健康叶片的判别结果作为输出,利用支持向量机算法,通过对样本的分类学习训练构建黄瓜白粉病和健康叶片的分类识别模型,随机选取120个样本作为训练集用于分类模型构建,其余80个样本作为测试集用于模型检验,并通过选取不同的核函数来获得最优模型。利用混淆矩阵对分类识别模型的准确率进行评价,当选取径向基核函数时,分类识别模型对黄瓜健康叶片和白粉病叶片的识别准确率最高,分别为100%和96.25%,总准确率为98.125%,具有较高的准确率。结果表明,利用可见光光谱信息并结合主成分分析和支持向量机算法,可以实现对黄瓜白粉病的快速准确识别,为黄瓜病害诊断提供了方法和参考依据。  相似文献   

8.
基于光谱分析技术的黄瓜与茎叶识别研究   总被引:1,自引:0,他引:1  
为了能够快速实时地识别温室中的黄瓜,研究了黄瓜和其茎叶的近红外反射光谱特性。利用近红外光谱仪在室内共采集138个样本(黄瓜46个,茎46个,叶46个)的反射光谱,进行Savitzky-Golay平滑后,抽取光谱中的108个样本作为校正集,采用偏差权重法选择信息量较大的光谱波段690~950 nm进行研究。在主成分分析(PCA)的基础上,结合马氏距离建立识别模型,剔除了7个异常样本。用剩余的101个样本进行偏最小二乘法建模,对校正集之外的30个样本进行预测。结果显示预测值和实际值的相关性达0.994 1,正确识别率达100%。说明黄瓜、茎和叶的近红外反射光谱特性之间有一定差异,可以用近红外光谱技术进行鉴别,为黄瓜识别提供了一种新的方法和思路。  相似文献   

9.
非线性荧光光谱的神经网络分析及其应用   总被引:8,自引:4,他引:4  
大功率超快脉冲激光和气体相互作用可产生非线性荧光光谱,不同的气体分子具有不同的非线性荧光光谱。因而这种光谱可以作为物质的指纹模式加以识别分类,进而获知气体的成分。由于不同气体分子的光谱在同一波段上有很大的交叉重叠,用传统的光谱分析方法分析存在困难,采用神经网络方法分析上述非线性荧光光谱,利用经过预处理的荧光光谱数据作为模式样本,其中一部分样本作为学习样本对级联神经网络进行训练,用训练好的网络对所有样本进行实时识别,学习样本和测试样本的的正确识别率均可达100%,结果表明此方法可实时判断混合气体的组分。  相似文献   

10.
介绍一种基于光谱检测和数据驱动模型的非接触式血液物种识别技术。选取了4个物种(猴144,大鼠203,狗133,人169)共计649个血样作为原始样本。超连续谱激光光源的波长范围是450~2 400 nm。分别采集抗凝管盛装血液样本的后向散射可见光谱(294~1 160 nm)和十个不同空间位点的前向散射近红外光谱(1 021~1 757 nm),将十一条光谱数据顺序连接为一维数据作为每个样本的原始数据。利用主成分分析法对数据集进行特征信息提取,保留原始差异信息量的99.99%,同时将数据量压缩为原始数据量的1.5%,提高分类识别的运算效率。对不同数量的训练集和验证集进行训练预测实验表明,十折交叉验证的识别误差率随着样本数量的增加而降低,样本库规模的增大可以提高识别的精确度。由于数据驱动模型是基于机器学习算法的数据流处理模型,因而可以采用多种不同的分类算法实现。通过比较人工神经网络、支持向量机、偏最小二乘回归、多元线性回归、随机森林和朴素贝叶斯的识别效果可以发现,不同算法的识别效果具有类别差异性,即各个算法的正确识别率排序在不同的物种中是有差异的。因而实际应用中,在选择数据驱动模型时,除了需要考虑算法的整体识别率之外,当对部分类别的识别效果有额外要求时,还应该考虑算法本身的类别差异性。  相似文献   

11.
近红外光谱建模样本选择方法研究   总被引:1,自引:0,他引:1  
针对小麦品种多分类问题,使用近红外光谱进行定性分析。建模样本增加能够使模型包含信息增多,但同时也会导致信息冗余,增加建模时间和存储空间,所以需要通过样本选择降低数据量。如果盲目选择必然会使信息丢失,模型效果将大打折扣,因此,在传统选择方法基础上,提出k近邻-密度样本选择方法。使用多天采集的小麦种子近红外漫反射光谱,在对其原始光谱进行预处理和特征提取后,分别使用随机抽样、k近邻和k近邻-密度三种方法进行建模样本选择,然后建立仿生模式识别模型和改进的仿生模式识别模型。实验结果显示,在建立的仿生模式识别模型中,使用k近邻-密度样本选择方法的模型识别效果优于另两种方法,且建模样本量大大降低;而在改进的仿生模式识别模型中,使用k近邻-密度样本选择方法识别效果明显优于随机抽样,略好于k近邻方法,但使用k近邻-密度方法所选择的样本数量远少于k近邻方法。结果证明k近邻-密度样本选择方法不仅能够大大降低建模样本量,而且保证了模型质量,对解决小麦品种多分类问题有明显效果。  相似文献   

12.
用于实时识别三维物体的级联神经网络模型的优化方法   总被引:4,自引:1,他引:3  
利用级联神经网络模型对多个三维目标进行识别 ,为提高其正确识别率 ,提出多种优化方法 ,它们可单独使用 ,也可以联合使用。对不变性编码、算法、互连权重的二值化方法、样本优选等进行了研究和探讨。利用优化后的模型对三个飞机模型在视场内的任意位置、任意取向 (面内旋转 36 0° ,面外旋转大于 45°)的投影进行识别。计算机模拟表明正确识别率达到 96 %以上。  相似文献   

13.
种子纯度反映种子品种在特征特性方面典型一致的程度,提高种子纯度检测的准确性和可靠性对保证种子的质量具有重要的意义。高光谱图像技术可以同时反映种子的内部特征和外部特征,在农产品无损检测中已经得到广泛应用。利用近红外高光谱图像实现农产品无损检测的实质就是建立光谱信息与农产品品质参数之间的数学模型关系。但光谱信息易受环境、时间的影响,当待测样本的产地或者年份发生改变时光谱信息也随之改变,导致建立的模型的稳定性变差、泛化能力减弱。针对这一问题,采用主动学习算法选择具有代表性的待测样本,最终以添加最少最优的样本数来扩大原模型的样本空间,从而实现模型的快速更新,提高模型的稳定性,同时与基于随机选择算法(RS)和Kennard-Stone算法(KS)的模型更新效果进行比较。实验结果表明:在不同样本集划分比例下(1∶1, 3∶1, 4∶1),利用主动学习添加40个新样本更新后的2010年的玉米种子纯度检测模型对2011年新样本的预测精度由47%,33.75%,49%提高到98.89%,98.33%,98.33%;利用主动学习添加56个新样本更新后的2011年的玉米种子纯度检测模型对2010年新样本的预测精度由50.83%,54.58%,53.75%提高到94.57%,94.02%,94.57%;同时基于主动学习算法的模型更新效果明显优于RS和KS。因此基于主动学习算法实现玉米种子纯度检测模型的更新是可行的。  相似文献   

14.
利用光谱技术实现农产品、食品品质无损检测的实质是建立样本光谱信息与样本品质参数之间的机器学习模型。为了获得具有良好泛化性能的机器学习模型,通常需要大量的标记样本,然而,获取样本的光谱信息相对容易,但标注样本品质参数的过程往往涉及到大量的时间和经济成本,并且具有破坏性。主动学习是一种减少训练集有标记样本数量的方法,通过选择最有价值的样本进行标记,而不是随机选择。因此,主动学习能够控制向训练集添加哪些样本,模型不再是被动地接受用于建模的样本。在分类任务中已经提出较多关于主动学习的算法,但回归任务中的研究却相对较少,且现有的用于回归任务的主动学习算法大多是有监督的,即需要少量有标记样本训练初始模型。本文提出了一种基于无监督主动学习方法的训练样本选择策略。该方法首先通过层次凝聚聚类对无标记(标准值)光谱数据集进行多样性划分,获得不同的聚类簇;然后通过局部线性重建算法在每个聚类簇中选择最具代表性的样本构成训练样本集,最后基于训练集构建模型。利用两个年份三个品种苹果的近红外光谱数据,构建了其可溶性固形物含量和硬度的偏最小二乘预测模型,用于验证所提出方法的有效性。实验结果表明:所提出的方法要优于已有的样本选择策略,可以有效地提高模型精度,减少在模型训练中的破坏性理化实验。同时,与随机采样(RS)、Kennard-Stone算法(KS)、光谱-理化值共生距离算法(SPXY)这三种光谱领域常用的样本选择算法相比,该研究所提出的方法表现出了最佳的性能, 基于所提出的无监督主动学习算法选取200个样本作为训练集所建立的可溶性固形物含量预测模型的预测均方根误差相对于其他三种算法降低了2.0%~13.2%,硬度预测模型的预测均方根误差相对降低了1.2%~15.7%。  相似文献   

15.
我国每年产生废旧纺织品超过2 600多万吨,且随着经济的发展呈现逐年增多的趋势,而其再生利用率不足10%。废旧纺织品组分的多样性和结构的复杂性是影响其准确分类、快速回收和高附加值再利用的最大障碍。人工识别分选既费时费力又不准确,而近红外光谱分析技术可对其进行快速无损高效识别分选。在前期探究的最佳测试条件下,利用自主研制的“纤维制品在线近红外高效识别与分选装置”对聚酯、棉、毛、锦纶、真丝、粘胶、腈纶、聚酯/毛、聚酯/棉、聚酯/锦纶、真丝/棉混纺和“特殊类”共计12类1 060个废旧纤维织物样本进行在线原始近红外光谱采集。基于采集的样本在线原始NIR谱图,利用卷积神经网络方法,依据输入的样本光谱数据及对应分类标签进行网络训练,建立了12类废旧纺织品在线NIR定性识别模型。对比一维、二维卷积神经网络模型,其二维模型较优,该模型是将901~2 500 nm的一维数组归一化后转化为40×40像素的二维灰度图像,再交替进行多次卷积和池化来进行光谱特征的提取、压缩和数据降维。通过模型计算得到每类废旧纺织品样本的类别概率值,取其最大值作为该类织物的最终分类。本模型训练过程设置为500轮,每次取32个样...  相似文献   

16.
近红外光谱技术快速识别针叶材和阔叶材的研究   总被引:1,自引:0,他引:1  
对一种针叶材和一种阔叶材的横切面采集波长范围为780~2 500 nm的近红外漫反射光谱,结合偏最小二乘判别分析法(PLS-DA)对针叶材杉木和阔叶材桉树快速识别的可行性进行了研究,结果表明:(1)利用近红外光谱结合PLS-DA法建立的识别模型对建模样品的识别正确率达到100%,识别模型预测的分类变量值与实际值之间相关系数r达到0.99,SEC为0.07;(2)即使采用短波区域780~1 100 nm的近红外光谱也可以获得理想的识别结果(识别正确率为100%),识别模型的r也达到0.99,SEC为0.07;(3)利用近红外光谱建立的识别模型对未知样本的识别正确率都为100%,说明近红外光谱技术可以快速、准确识别针叶材和阔叶材,这为木材识别提供了一种新方法和技术,也为开发低成本的近红外光谱识别仪器提供了科学依据。  相似文献   

17.
手写汉字识别是手写汉字输入的基础。目前智能设备中的手写汉字输入法无法根据用户的汉字书写习惯,动态调整识别模型以提升手写汉字的正确识别率。通过对最新深度学习算法及训练模型的研究,提出了一种基于用户手写汉字样本实时采集的个性化手写汉字输入系统的设计方法。该方法将采集用户的手写汉字作为增量样本,通过对服务器端训练生成的手写汉字识别模型的再次训练,使识别模型能够更好地适应该用户的书写习惯,提升手写汉字输入系统的识别率。最后,在该理论方法的基础上,结合新设计的深度残差网络,进行了手写汉字识别的对比实验。实验结果显示,通过引入实时采集样本的再次训练,手写汉字识别模型的识别率有较大幅度的提升,能够更有效的满足用户在智能设备端对手写汉字输入系统的使用需求。  相似文献   

18.
为了克服单一模型预测精度很难进一步提高的不足,利用近红外光谱分析结合基于Stacking框架的异构集成学习模型实现对油页岩含油率的检测。以松辽盆地某区块所取230个油页岩岩芯样本为研究对象,使用低温干馏法测量油页岩样本的含油率,同时扫描每个样本对应的近红外光谱数据。样本使用蒙特卡洛算法进行异常样本剔除,将剔除异常样本后的213个数据按照3∶1的比例随机划分为训练集和预测集。利用去趋势加基线校正方法进行预处理消除光谱数据中噪声和基线漂移,利用随机森林算法进行波长重要性排序并保留重要波长,在此基础上采用CARS算法进行特征波长提取,进一步降低数据维度。最后,构建以PLS, SVM, RF和GBDT为初级学习器,PLS回归模型为次级学习器的Stacking集成学习模型,各初级学习器模型参数使用网格搜索进行寻优。使用决定系数和预测均方根误差作为各模型的评价指标,探究单一模型和集成学习模型对油页岩含油率预测的准确性。研究结果表明,RF-CARS方法能够有效筛选重要波长,进而提高模型效率。基于Stacking的异构集成学习模型与单一模型(SVM和PLS)和同构集成学习模型(RF和GBDT)相比有更...  相似文献   

19.
不同种类的松脂因其化学组成的差异而对松脂下游产品的质量产生影响,因此确保松脂种类的稳定性是保证松脂下游产品质量的关键,针对在松脂原料采购过程中松脂种类识别困难的问题,提出了一种基于漫反射近红外光谱和偏最小二乘判别分析(PLSDA)相结合的分析技术,该技术能够快速识别马尾松松脂和湿地松松脂,为松脂原料采购提供可靠的种类信息。以在广西区内武鸣、防城、富川、梧州、百色、乐业共6个不同松脂产区采集所得的82个松脂样本进行建模,包括湿地松松脂51个,马尾松松脂31个,利用i-spec型近红外光谱仪采集松脂样本在900~1 700 nm范围内的近红外光谱。利用子窗口随机化分析法(SPA)进行变量选择,从510个波长点中优选出300个波长点组成的变量子集,再通过重复双重交叉检验技术(RDCV)确定偏最小二乘判别分析建模的潜变量数(n=7)。结果表明,所建立的分类模型能够准确识别两种不同种类的松脂,模型对于外部测试集中的松脂样本识别准确率为96.30%,能够满足松脂行业在原料采购过程中质量控制的需要。该方法具有分析速度快、操作简便、分析成本低、样本无损等优势,适用于松脂原料采购环节的质量控制。  相似文献   

20.
Xu C  Zhang PL  Ren GQ  Li B  Yang N 《光谱学与光谱分析》2010,30(11):2902-2905
提出了一种利用润滑油原子光谱分析技术对机械磨损状态进行监测的新方法。对磨合期润滑油原子光谱数据建立多维时间序列模型并视为标准模型,将新数据通过此模型后得到残差并选择残差方差阵元素作为新数据所属磨损状态的特征。然后,利用主成分分析法对高维特征进行降维,提取前三个主成分构成对应磨损状态的特征向量。最后,利用欧式距离度量对测试样本进行分类,达到了对机械磨损状态识别的目的。利用上述方法,通过对某型履带车辆发动机台架实验的光谱数据进行分析,对发动机磨损状态进行了有效识别,从而证明了所提方法的有效性。结果表明,将多维时间序列模型引入油液光谱分析技术,能够实现光谱信息的有效融合,提高机械磨损状态监测的准确性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号