首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 772 毫秒
1.
为探讨基于可见一近红外光谱技术快速检测牛奶中是否含有三聚氰胺的可行性.文章通过往液态奶中添加不同含量的三聚氰胺,共制备样本160个.利用Handheld Field Spec光谱仪获取样本光谱,其后采用不同的预处理方法对光谱数据进行预处理,然后分别建立数学模型,比较模型的好坏,得到采用移动平均平滑作为数据的预处理方法较好.从160个样本中随机的取出120个样本建模,剩下的40个样本作为独立的验证集.采用偏最小二乘回归法(PLS)和最小二乘支持向苗机法(LS-SVM)方法分别建立判别分析模型,利用独立的验证集对判别模型进行了预测验证.预测结果的预测相关系数(R2)分别为0.917 4(PLS)和0.910 9(LS-SVM),预测标准误差(RMSEP)分别为0.030 4(PLS)和0.046 7(LS-SVM).研究结果表明近红外反射光谱可以作为一种快速检测牛奶中三聚氰胺的方法.  相似文献   

2.
近红外光谱技术结合RCA和SPA方法检测土壤总氮研究   总被引:1,自引:0,他引:1  
基于近红外光谱技术结合连续投影算法和回归系数分析对检测土壤总氮含量进行研究。采集农田土壤样本近红外光谱数据,土壤样本数量共394个。由于原始光谱数据量大,在500~2 500 nm光谱波长范围基础上,为简化模型,在原始光谱基础上采用连续投影算法和回归系数分析提取特征变量,以两种变量选择方法提取的特征变量作为输入,分别采用偏最小二乘回归(PLS)、 多元线性回归(MLR)和最小二乘支持向量机(LS-SVM)建模方法建立总氮预测模型,共建立了9个预测模型,最优预测集的决定系数为0.81,剩余预测偏差RPD为2.26。研究表明,基于连续投影算法和回归系数分析选择的特征波长可以应用于近红外光谱检测土壤总氮含量,同时可以大大简化模型,适合开发便携式土壤养分检测仪。  相似文献   

3.
应用近红外高光谱成像技术预测甘蔗可溶性固形物含量   总被引:5,自引:0,他引:5  
为了探究应用近红外高光谱成像技术对甘蔗内部可溶性固形物(SSC)预测的可行性,试验样本选择三种不同品种中的240个甘蔗节作为研究对象。通过高光谱成像系统获取甘蔗节的近红外光谱信息和图像信息,并分别探讨了光谱信息和图像纹理信息对甘蔗可溶性固形物预测的可行性。采用最小二乘回归(PLSR),最小二乘支持向量机(LS-SVM)及主成分回归(PCR)建模方法构建甘蔗可溶性固形物的预测模型。比较了连续投影算法(SPA)、无信息变量消除算法(UVE)及区间偏最小二乘(iPLS)特征提取方法对预测结果的影响。实验结果表明:基于甘蔗的光谱信息能实现可溶性固形物的预测,其中偏最小二乘回归模型的建模集和预测集的相关系数分别为0.879和0.843,均方根误差分别为0.644和0.742。通过UVE算法提取105个有效波长所建立的PLSR模型的建模集及预测集相关系数分别为0.860和0.813,均方根误差分别为0.693和0.810。  相似文献   

4.
局部建模方法用于烟草样品的近红外光谱定量分析   总被引:1,自引:0,他引:1  
采用近红外光谱在主成分空间的距离作为样本相似性的判据,建立了一种用于近红外光谱定量分析的局部建模方法。该方法首先对校正集的光谱进行主成分分析(PCA),然后基于主成分空间中预测样本与校正集样本的距离选择校正子集并建立局部偏最小二乘(PLS)回归模型。对欧氏距离和马氏距离的比较表明,欧氏距离可以更好地表达样本之间的相似性。将所建立的方法用于烟草样品中氯和尼古丁含量的测定,结果表明局部建模方法比常用的全局建模方法具有更好的预测准确性,特别是在低含量成分的预测中具有明显优势。  相似文献   

5.
偏稳健M回归在人体血糖浓度近红外无创检测中的应用   总被引:1,自引:0,他引:1  
采用偏稳健M回归方法有效地解决了人体血糖浓度近红外无创检测研究过程中由于样本奇异值影响模型稳健性的问题。该方法源于现有的迭代变权偏最小二乘法,计算快、易于实现,具有M估计的所有性质,且当权函数选择合适时,能降低奇异值的影响,建立具有稳健性的校正模型。采用该方法对近红外光谱实验数据进行了处理,并与传统的偏最小二乘(partialleast squares,PLS)建模方法进行了比较。结果表明,与PLS相比,该方法可建立稳健的校正模型提高预测精度,更适合复杂样品建模,对于人体血糖浓度近红外无创检测的进一步研究具有应用价值。  相似文献   

6.
可见光/近红外光谱技术快速测定橙汁柠檬酸含量   总被引:3,自引:1,他引:2  
为了快速无损测定橙汁的柠檬酸含量,提出了一种用可见光/近红外光谱技术进行检测的新方法。选用高效液相色谱法作为光谱柠檬酸测定的标定方法。采用平滑点数为5的移动平滑法对原始光谱进行预处理消除噪声。由于采集的光谱数据量非常大,为了减少建模时间,建模之前采用小波变换对经过预处理的大量光谱数据进行降维压缩,并在Matlab7.01中通过自编程序实现此变换。利用光谱专用分析软件Unscrambler 9.5,对压缩后的新变量进行分析,建立偏最小二乘(PLS)校正模型。考虑到不同小波基及分解尺度对数据压缩的影响,采用预测平方和PRESS值最小的评价标准,选择最佳的小波基Db4及分解尺度5。用于本实验的样本总数为40,其中30个样本进行建模,10个用于预测。用校正集相关系数(r)和标准偏差(SEC)作为校正模型的评价指标,预测结果采用预测相关系数(r)和预测标准偏差(SEP)来评定。文章将基于小波变换的PLS模型与直接建立的PLS模型进行了比较,偏最小二乘法结合小波变换的模型预测相关系数为r=0.901, 预测标准偏差SEP=0.937;而由PLS建立的模型其预测相关系数r=0.849,预测标准偏差SEP=1.662。由此可见,由偏最小二乘法结合小波变换所得模型效果优于单独使用偏最小二乘法的结果。  相似文献   

7.
葡萄浆果糖度可见/近红外光谱检测的研究   总被引:4,自引:1,他引:3  
针对可见/近红外光谱与水果糖度存在非线性相关的特点,利用漫反射光谱测定方法获取了葡萄浆果的可见/近红外光谱,提出了应用偏最小二乘(PLS)结合人工神经网络(ANN)建立葡萄浆果糖度的预测模型,利用偏最小二乘法(PLS)对原始光谱数据进行处理,得出交叉检验的最佳主因子数为3,并将3个主因子的得分作为三层BP神经网络的输入。通过定标集样本对BP神经网络进行训练,用优化的BP神经网络模型对预测集样本进行预测。PLS-ANN模型对样本的预测模型检验参数r2为0.908,RMSEP为0.112,Bias为0.013,好于只使用PLS模型的预测模型检验参数r2为0.863,RMSEP为0.171, Bias为0.024。结果表明,利用近红外光谱技术无损检测葡萄浆果糖度等内部品质是可行的,为今后进一步分析建立浆果内部品质预测模型奠定了基础。  相似文献   

8.
提出一种利用可见/近红外光谱技术进行杉木林土壤全氮测定的方法.利用不同方法实现了土壤光谱的预处理,并以偏最小二乘回归算法(PLS)建立土壤氮含量估测模型对其进行比较分析,发现小波除噪结合多远散射校正能最有效地消除原始光谱的噪声与背景信息,此时PLS模型校正集与预测集R2分别为0.891与0.885.为优化模型,对预处理后的光谱数据采用主成分分析法(PCA)降维,以最小二乘支撑向量机回归算法(LS-SVR)建立了土壤氮含量估测模型,其校正集与预测集R2分别提高至0.921与0.917,具有比PLS算法更高的精度.结果表明:以可见/近红外光谱技术进行林地土壤氮含量快速监测是可行的,其中小波去噪结合多元散射校正系光谱预处理的优选方法,而LS-SVR则是建模的优选方法.  相似文献   

9.
近红外光谱结合化学计量学方法对癌症的辅助诊断已有了文献报道.该文测定了77例不同生理阶段的子官内膜组织病理切片的近红外光谱,对其分别进行多元散射校正(MSC)、正交信号校正(OSC)以及二者联用的预处理方法,采用拉丁配分法选择3/4样本作为训练集,1/4样本作测试集,建立支持向量机(SVM)模型进行分类,并与基于同样预处理方法建立的偏最小二乘(PLS)模型分类结果进行了比较.SVM对正常、增生和癌变三类不同的组织样品分类结果较好,总分类正确率约92%,好于PLS模型的结果(最高正确率90%).研究结果表明,光谱数据的预处理和建模方法对分类结果有重要影响,SVM结合子宫内膜组织的近红外光谱有望发展成为一种新型的肿瘤诊断方法.  相似文献   

10.
采用近红外光谱对物质浓度进行准确的在线检测对于生产优化具有重要意义。建立检测模型需要从近红外光谱中提取相关信息,代表性样本越多,提取的信息越有效,所建模型的精度越高。随着产品纯度的提高,样本的区分度下降,样本的变异系数小,多样性不足,并且存在测量噪声以及化验室人工检测样品浓度值时的测量误差,会导致物质浓度与光谱之间缺乏相关性,传统的建模方法无法建立可靠的近红外检测模型。为了解决这个问题,提出了一种基于PLS子空间对齐的迁移学习建模方法,应用于2,6-二甲酚精馏提纯过程中产品塔高纯度产品的在线检测。在制备化工单体2,6-二甲酚过程中,存在副反应和未反应完全的杂质,生产反应后的物料要顺序经过不同的精馏塔,最后在产品塔获得纯度高于99%的产品,产品塔的质量检测尤为重要。由于产品塔检测点近红外光谱数据缺乏多样性,检测模型的泛化能力较弱。该研究采用偏最小二乘为2,6-二甲酚精馏提纯过程中不同检测点的数据集创建子空间,然后通过最小化其他检测点数据子空间与产品塔检测点数据子空间的布雷格曼(Bregman)散度,将其他检测点数据的子空间对齐到产品塔数据子空间,减小其他检测点数据子空间与产品塔检测点数据子空间的特征分布差异,既避免了投影到公共子空间产品塔检测点数据特征信息的损失,又能充分利用其他检测点数据的特征信息,然后在迁移后的子空间完成偏最小二乘回归建模,通过竞争学习加权策略确定最终的模型系数,从而提升产品塔检测模型的性能。在2,6-二甲酚纯度近红外检测数据集上进行了仿真验证,并探讨了迁移其他检测点不同数量的数据对产品塔检测模型性能的影响,产品塔检测模型的最大性能提升达到了52.19%,RMSEP值由0.059 4下降到0.028 4,与传统建模方法支持向量机回归和BP神经网络相比具有明显的优势。  相似文献   

11.
应用可见-近红外光谱技术快速无损鉴别婴幼儿奶粉品种   总被引:6,自引:5,他引:1  
为了快速无损鉴别婴幼儿奶粉品种,提出了结合偏最小二乘(PLS)法和人工神经网络(ANN)综合预测婴幼儿奶粉品种的新方法。获取婴幼儿奶粉样本在400~1 000 nm波段的漫反射光谱,采取平均平滑法和多元散射校正(MSC)进行预处理,用PLS建立校正模型进行模式特征分析及主成分的提取。经过交互验证法判别,提取7个主成分作为神经网络的输入变量,奶粉的品种值作为输出,建立了三层BP神经网络。9个典型品种的婴幼儿奶粉各取样本30个,共计270个作为训练集。随机抽取的各个品种的10个样本,共90个作为预测检验样本,结果表明,90个未知样本的品种预测准确率为100%。说明提出的方法具有很好的分类和鉴别作用,为婴幼儿奶粉的品种快速无损鉴别提供了一种新方法。  相似文献   

12.
利用神经网络提高偏最小二乘法的NIR多组分分析精度   总被引:4,自引:2,他引:2  
提出了一种神经网络(ANN)和偏最小二乘法(PLS)结合的新的近红外(NIR)多组分分析法。该方法首先把训练样本中待测组分涵盖的浓度区间分成若干个子区间,利用各个子区间的训练样本分别建立PLS校正模型,然后利用ANN对未知样本进行分类,判断其所属的浓度子区间,应用对应子区间上的校正模型计算预测样本的组分浓度。和传统的PLS比较,此方法改善了模型的适应性,显著地提高了预测精度。实验及数据处理结果证明了本方法的有效性。  相似文献   

13.
提出了一种基于DPLS+LDA的玉米近红外光谱定性分析新方法.该方法在训练时,首先用包含30个玉米品种每个品种20个近红外光谱样本的训练集进行DPLS回归,确定最佳DPLS主成分数为28;然后对训练集光谱进行DPLS特征提取后再进行LDA分析,确定最佳LDA主成分数为26,并提取LDA特征.识别时,测试样本经过DPLS...  相似文献   

14.
从校正的角度出发,研究了近红外定性分析中模型稳定性问题。以13个玉米品种为研究对象,针对数据采集时间不同带来的模型失效问题,借鉴近红外光谱定量分析中两台仪器间模型传递的思想,将直接模型传递(Direct Standardization)算法用于校正同一仪器不同时间采集的光谱, 使得一次建立的品种鉴别模型,能用于其余时间测试数据的鉴别。首先采用Kennard/Stone算法在主光谱集中选取校正样品集,按照对应的编号从从光谱集中取出对应的数据,然后对校正样品集采用DS算法求取两组数据间的变换关系,再对剩余的从光谱集进行相应的变换得到适用于模型的光谱。实验中对比了校正样本数和模型校正位置对校正结果的影响,分别从品种定性鉴别准确性和校正前后主光谱数据和从光谱数据分布距离两方面分析了实验结果。结果表明,该方法能有效地解决同一仪器随着采样时间推移产生的光谱偏移现象,对采样时间不同的测试集均得到较高的识别率,提高了模型的鲁棒性和适用范围,由实验结果可见,校正位置处于特征提取之后时,校正效果最佳。  相似文献   

15.
Despite the importance of few-shot learning, the lack of labeled training data in the real world makes it extremely challenging for existing machine learning methods because this limited dataset does not well represent the data variance. In this research, we suggest employing a generative approach using variational autoencoders (VAEs), which can be used specifically to optimize few-shot learning tasks by generating new samples with more intra-class variations on the Labeled Faces in the Wild (LFW) dataset. The purpose of our research is to increase the size of the training dataset using various methods to improve the accuracy and robustness of the few-shot face recognition. Specifically, we employ the VAE generator to increase the size of the training dataset, including the basic and the novel sets while utilizing transfer learning as the backend. Based on extensive experimental research, we analyze various data augmentation methods to observe how each method affects the accuracy of face recognition. The face generation method based on VAEs with perceptual loss can effectively improve the recognition accuracy rate to 96.47% using both the base and the novel sets.  相似文献   

16.
提出了一种基于偏最小二乘增量式神经网络的近红外光谱定量分析模型。该模型采用典型三层反向传播神经网络(BPNN),不同波长吸光度和成分浓度是模型的输入和输出。在使用历史样本训练之前先进行偏最小二乘(PLS)回归,所得自变量和因变量的历史负荷矩阵分别用于确定模型输入层和输出层的初始权值,且自变量的主成分个数作为隐层的节点数。当获得新的样本时,对新数据与历史负荷矩阵组合后进行PLS回归,将所得新的负荷矩阵与历史负荷矩阵融合后作为模型输入层和输出层新的初始权值,接着使用新样本对模型进行训练来实现增量式更新。将所提模型与PLS、BPNN、基于PLS的BPNN、递归PLS在天然气燃烧烟气近红外光谱数据上测定后比较。对于烟气中二氧化碳浓度的预测,所提模型的预测均方根误差(RMSEP)分别降低了27.27%,58.12%,19.24%和14.26%;对于烟气中一氧化碳浓度的预测,所提模型的RMSEP分别降低了20.65%,24.69%,18.54%和19.42%;对于烟气中甲烷浓度的预测,此模型的RMSEP分别降低了27.56%,37.76%,8.63%和3.20%。实验结果表明,所提模型不仅通过PLS对BPNN结构和初始权重的优化,使模型具有较强的预测能力,而且能在已建模型信息的基础上,不访问旧数据而用新增样本即可完成自身的增量式更新,从而使模型具有较好的稳健性和泛化性。  相似文献   

17.
近红外光谱法快速测定新疆薰衣草精油主要组分   总被引:1,自引:0,他引:1  
为建立快速测定新疆薰衣草精油中芳樟醇(linalool)、乙酸芳樟酯(linalyl acetate)含量的定量分析模型,采用近红外吸收光谱法(NIR)测定了165个精油样品,通过对近红外光谱吸收峰分析,在7 100~4 500 cm-1波数范围内化学信息量比较丰富且噪音低,可选择此波数段为分析区间。剔除8个异常样本后,通过聚类方法划分为105个校正集样本和52个验证集样本,结合气相色谱质谱(GC-MS)法测定的薰衣草精油linalool和linalyl acetate的含量,建立原始数据矩阵。对比不同的预处理方法对原始近红外光谱的过滤作用,其中正交信号变换(OSC)方法效果明显,对两种化合物的预测均方根误差(RMSEP) 分别为0.226和0.558,再用向前间隔偏最小二乘法(FiPLS)剔除与待测成分无关或呈非线性关系的波长点,最终得到8个间隔区间共160个波长点的数据子集。使用OSC-FiPLS优化处理的数据子集结合偏最小二乘法(PLS)建立新疆薰衣草精油中linalool和linalyl acetate的快速定量分析模型,在模型中二成分的隐变量数都为8。交互验证均方根误差(RMSECV)分别为0.170和0.416;预测均方根误差(RMSEP)分别为0.188和0.364。结果表明,经OSC和FiPLS预处理建立的PLS-NIR定量分析模型稳健性好,测定精度高,能快速测定薰衣草精油中linalool和linalyl acetate含量,并且具有良好的预测能力。可为新疆薰衣草精油主要成分的快速定量分析提供一种新的有效方法。  相似文献   

18.
转基因水稻及其亲本叶片的可见/近红外光谱分析   总被引:1,自引:0,他引:1  
应用可见/近红外光谱技术实现了转基因水稻叶片的快速识别和叶绿素含量(SPAD)的快速检测。建立偏最小二乘-支持向量机(LS-SVM)鉴别模型,校正集的正确率为100%,同时应用连续投影算法(SPA)提取有效波长,建立SPA-LS-SVM鉴别模型,只用了全变量的0.3%进行建模,其预测集的正确率达到87.27%。在定量分析中,各模型的最优结果均来自经过正交信号校正(OSC)的光谱数据,经过SPA处理后的模型均优于最优的全波段PLS模型,说明SPA是一种有效的波长选择方法。最优SPAD值预测模型为SPA-LS-SVM,其相关系数(r)和预测均方根误差(RMSEP)分别为0.902 2和1.312 1,获得了满意的结果。这说明提出的SPA-LS-SVM方法能快速识别转基因水稻叶片并对SPAD值进行准确预测,为实现大田活体鉴别与连续监测提供了新方法。  相似文献   

19.
This work was undertaken to establish a quantitative analysis model which can rapid determinate the content of linalool, linalyl acetate of Xinjiang lavender essential oil. Totally 165 lavender essential oil samples were measured by using near infrared absorption spectrum(NIR), after analyzing the near infrared spectral absorption peaks of all samples, lavender essential oil have abundant chemical information and the interference of random noise may be relatively low on the spectral intervals of 7100-4 500 cm(-1). Thus, the PLS models was constructed by using this interval for further analysis. 8 abnormal samples were eliminated. Through the clustering method, 157 lavender essential oil samples were divided into 105 calibration set samples and 52 validation set samples. Gas chromatography mass spectrometry (GC-MS) was used as a tool to determine the content of linalool and linalyl acetate in lavender essential oil. Then the matrix was established with the GC-MS raw data of two compounds in combination with the original NIR data. In order to optimize the model, different pretreatment methods were used to preprocess the raw NIR spectral to contrast the spectral filtering effect, after analysizing the quantitative model results of linalool and linalyl acetate, the root mean square error prediction(RMSEP) of orthogonal signal transformation (OSC) was 0.226, 0.558, spectrally, it was the optimum pretreatment method. In addition, forward interval partial least squares (FiPLS) method was used to exclude the wavelength points which has nothing to do with determination composition or present nonlinear correlation, finally 8 spectral intervals totally 160 wavelength points were obtained as the dataset. Combining the data sets which have optimized by OSC-FiPLS with partial least squares(PLS) to establish a rapid quantitative analysis model for determining the content of linalool and linalyl acetate in Xinjiang lavender essential oil, numbers of hidden variables of two components were 8 in the model. The performance of the model was evaluated according to root mean square error of cross-validation (RMSECV) 9 root mean square error of prediction (RMSEP). In the model, RESECV of linalool and linalyl acetate were 0.170 and 0.416, respectively; RMSEP were 0.188 and 0.364. The results indicated that raw data was pretreated by OSC and FiPLS, the NIR-PLS quantitative analysis model with good robustness, high measurement precision; it could quickly determine the content of linalool and linalyl acetate in lavender essential oil. In addition, the model has a favorable prediction ability. The study also provide a new effective method which could rapid quantitative analysis the major components of Xinjiang lavender essential oil.  相似文献   

20.
极限学习机理论(extreme learning machine, ELM)作为一种新的化学计量学方法,在近红外光谱定量分析中的应用研究,已引起学术界的高度重视。然而,由于光谱数据维数较高,建立ELM模型时需要大量的隐节点,导致隐含层输出矩阵维数高且存在高度共线性,用现有的Moore-Penrose广义逆算法求取隐含层输出矩阵与待测性质间的回归模型往往会存在病态问题。基于ELM建立光谱波长变量与性质之间的回归模型,提出以ELM模型隐含层输出矩阵作为新的变量,采用作者最新提出的基于变量投影重要性的改进叠加PLS算法(stacked partial least squares regression algorithm based on variable importance in the projection,VIP-SPLS),建立新变量与待测性质间的回归模型。VIP-SPLS算法充分利用了每个隐节点的输出信息,能有效解决高维共线性问题,同时具有模型集成的优点,从而改进了ELM模型的性能。将提出的改进ELM算法(improved ELM,iELM)应用于标准近红外光谱数据集,结果表明iELM模型的精度相对于现有的PLS模型和ELM模型分别显著提升了29.06%和27.47%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号