共查询到18条相似文献,搜索用时 593 毫秒
1.
2.
一种基于聚类和主成分分析的异常检测方法 总被引:1,自引:0,他引:1
提出了一种基于聚类和主成分分析的异常检测方法,该方法利用聚类分析将训练数据划分为不同的子集,从而得到正常模式在特征空间中的分布,然后利用主成分分析来提取各行为子集的特征轮廓,最后利用各子集的PCA变换矩阵进行检测。实验结果证明了基于主成分分析的异常检测方法的有效性。 相似文献
3.
4.
为了能客观地反映中医舌诊所蕴涵的病理信息,首次采用近红外光谱和神经网络对疾病进行诊断。分别采用了BP网络、广义回归神经网络(GRNN)、主成分分析和广义回归神经网络(PCA-GRNN)结合的三种模型在舌诊光谱法中的分析预测,首先对三种建模方法进行了分析,再用采集的健康人和糖尿病患者舌诊光谱数据进行校正模型的建立,两类舌诊光谱样本各39例,共计78例样本,在神经网络学习中,将其分成训练集样本60例和预测集样本18例,分别利用所建的三种模型对舌诊光谱样本进行训练和预测。实验结果是三种模型中PCA-GRNN相结合的方法平均绝对误差最小为13.2%、训练时间最短为0.072255s,以相对偏差在0.5以内为正确的情况下,其正确率为100%。说明用PCA-GRNN模型可以应用于舌诊光谱法的分析,并取得较好的分析结果,这对中医舌诊的客观化起到了一定的推动作用。 相似文献
5.
为了提高个体神经网络精度及差异度进而提高神经网络集成(Neural Network Ensemble,NNE)的泛化性能,提出了一种基于二次聚类的神经网络集成方法。首先对所有样本进行聚类,得到第一次聚类样本子集;然后对每一类样本子集进行二次聚类,得到每一子类的样本子集,通过Affinity Propagation(AP)聚类使得"类内相似,类间相异"的准则最大化,类内样本能够反映真实的数据分布;最后按照排列组合的方式,从二次聚类的每个样本子集中选取一类样本构成训练集来构造一个个体神经网络。这样从不同类中选择样本集构造的个体神经网络差异性较大,既能使数据的规模较小,又能反映真实的数据分布,用这种方法产生的个体神经网络进行集成具有较高的性能。仿真实验表明,该方法能够取得较好的性能。 相似文献
6.
7.
为了提高神经网络分类器的性能,提出一种基于K均值聚类的分段样本数据选择方法.首先通过K均值聚类把训练样本根据已知的类别数进行聚类,对比聚类前后的各类样本,找出聚类错误的样本集和聚类正确的样本集;聚类正确的样本集根据各样本到聚类中心的距离进行排序并均分为五段,挑选各类的奇数段样本和聚类错误的样本构成新的训练样本集.该方法能够提取信息量大的样本,剔除冗余样本,减少样本数量的同时提高样本质量.利用该方法,结合人工和UCI数据集对三种不同的神经网络分类器进行了仿真实验,实验结果显示在训练样本平均压缩比为66.93%的前提下,三种神经网络分类器的性能都得到了提高. 相似文献
8.
针对物联网环境下产生的新型网络攻击的数量持续上升和复杂性不断升高,传统的异常检测算法误报率高、检测率低以及数据量大而造成计算困难等问题,提出了一种基于子空间聚类(Subspace Clustering,SSC)和BP神经网络相结合的异常检测算法.首先在网络数据集上通过子空间聚类算法中最常用的CLIQUE算法得到不同的子空间;其次对不同子空间中的数据进行BP神经网络异常检测,计算预测误差值,通过与预先设定好的精度进行比较,来不断更新阈值进行修正,以达到提高识别网络攻击的能力.仿真实验采用NSL-KDD公开数据集和物联网环境下的网络攻击数据集,将NSL-KDD公开数据集分割为4种单一攻击子集和1种混合攻击子集,通过与K-means,DBSCAN,SSC-EA以及k-KNN异常检测模型进行比较,在混合攻击子集中,SSC-BP神经网络模型的检测率比传统的K-means模型的检测率提高了6%,误检率降低了0.2%;而在4种单一攻击子集中,SSC-BP神经网络模型都能以最低的误检率检测出最多的受到攻击的网络.在物联网环境下的网络攻击数据集上,SSC-BP神经网络模型的性能均优于其他几种对比模型. 相似文献
9.
《计算机与应用化学》2016,(2)
集成建模方法能显著提高软测量模型的预测性能,其中选择性集成通过剔除一些性能不佳的子模型,能进一步提高整体软测量模型预测性能。针对目前选择性集成研究中因忽略了数据间的差异性而导致模型预测性能不佳的问题,提出了一种动态选择性集成神经网络软测量建模方法。首先将原始数据集分为训练集和验证集,采用bootstrap算法对训练集进行差异性扰动,建立了多个神经网络子模型;然后对每个待测样本,采用K-最近邻搜索算法从验证集中找到一个最近邻子集,用该子集评估各神经网络子模型的预测性能,为待预测样本筛选合适的神经网络子模型;最后根据各子模型的预测性能合理分配组合权重,从而建立集成模型,并实现待预测样本的预测。将该建模方法应用于聚丙烯熔融指数软测量研究中,研究结果表明:与单一神经网络、常规全集成和静态选择性集成神经网络模型相比,基于动态选择性集成神经网络的熔融指数软测量模型具有更佳的预测精度。 相似文献
10.
针对煤炭原始近红外光谱数据中存在噪声的问题,提出了基于De-SNV与小波阈值去噪组合的煤炭近红外光谱数据预处理方法。采用缺省软阈值法进一步对经过Savitzky-Golay平滑和De-SNV处理的光谱数据去噪,并分别建立了水分、灰分和挥发分的PLS校正模型,通过分析模型的预测性能对该方法的有效性进行评估。实验结果表明,经过该方法预处理的光谱数据所对应的PLS校正模型性能明显优于使用原始光谱数据所建立的PLS校正模型,水分、灰分和挥发分的PLS校正模型的预测均方根误差分别降低至0.007 07,0.040 8,0.008 66,决定系数分别提高至0.858 7,0.743 8,0.778 5。 相似文献
11.
12.
介绍了一种利用Gaussian正则化方法改进RAN网络的方法.运用改进的神经网络建立煤灰熔点的预测模型.预测结果表明,所建模型结构小、精度高、泛化能力强,具有很好的预测性能. 相似文献
13.
针对目前电力行业煤质分析的需求,提出了基于Hadamard近红外光谱的煤质分析技术,对Hadamard近红外光谱仪研制、控制分析软件设计、煤炭光谱信号采集、指标特征信息提取、定量模型建立五个环节综合考虑,研发了Hadamard近红外煤质分析系统.研究中,对41个不同质量指标的标准煤样进行了定量分析预测,考察了在相同粒径的条件下Hadamard近红外光谱对煤炭指标的预测能力,提出了基于ICA+LS-SVM算法的的煤炭指标预测方法,光谱数据与煤炭指标具有很好的相关性,相关系数普遍在0.9以上,取得了较好预测效果. 相似文献
14.
15.
宋剑杰 《计算机工程与应用》2012,48(17):243-248
针对污水处理过程中水质参数COD指标难以在线检测的问题,提出一种基于分布式改进BP神经网络和灰色预测的COD指标集成软测量模型。为反映污水处理过程的不同工况,采用满意聚类算法对数据样本进行聚类处理,将数据样本划分为若干个子样本集,利用改进BP神经网络方法分别为每个子样本集建立预测模型,计算当前输入数据与各个聚类中心的欧式距离,将欧式距离较小的部分预测模型的输出进行综合,得到分布式神经网络的COD指标预估值;为反映COD指标的时间相关性,基于COD指标历史数据采用改进灰色预测建模方法计算得到当前时刻COD指标的预估值;采用动态加权方法将获得两个COD指标预估值进行加权集成。仿真实验表明,集成软测量模型具有较好的预测性能,可以满足污水处理过程COD指标实时检测的精度要求。 相似文献
16.
针对建立近红外光谱煤质定量分析模型时训练集中的异常样品严重影响模型预测精度的问题,提出一种二次诊断法剔除异常样品:利用模糊C均值聚类法对样品进行聚类,得到可疑样品;将可疑样品作为验证集,通过PCA-GA-BP模型进行二次诊断,剔除异常样品。实验对比了训练集中异常样品剔除前后,模型对15组待测样品的预测能力,结果表明该方法能够准确剔除异常样品,并有效提高模型的预测精度。 相似文献
17.
针对复杂系统多变量序列预测研究中数据样本过多、信息冗余等问题,从学习样本选择和聚类中心优化两方面对径向基函数(RBF)网络进行改进.基于复杂系统多变量时间序列,首先采用一个线性相关函数和一个非线性相关函数分别计算多变量状态间的线性相关性和非线性相关性,确定一个包含系统有效信息的小数据集;然后基于小数据集,采用K均值聚类方法确定RBF网络的隐层聚类中心,并引入局部搜索过程,优化聚类中心结果;输入其它训练样本,确定网络权值.仿真结果表明,与常规RBF网络学习方法比较,在隐层节点数目相同情况下,改进的方法有效地确定了网络的聚类中心,达到更好的预测精度. 相似文献
18.
改进神经网络在芝麻油掺伪检测中的应用 总被引:1,自引:0,他引:1
研究芝麻油掺伪检测问题,提高检测精度。由于成分复杂,掺伪后化学成分变化,直观难以检测。传统物理或化学芝麻油掺伪检测方法操作复杂,设备昂贵,存在不同程度缺陷。结合近红外光谱技术和神经网络优点,提出一种RBF神经网络-近红外光谱的芝麻油掺伪检测方法(NIR-RBF)。首先采用近红外光谱提取芝麻油样本的光谱信息,然后采用主成分分析提取光谱信息主要有效成分,最后将主要有效成分输入到神经网络进行学习,得到芝麻油掺伪检测结果。采用建立的模型对掺入不同类型植物油的芝麻油进行检测,结果表明,相对于其它芝麻油掺伪检测方法,NIR-RBF提高了检测精度和速度,降低了检测误差,是一种快速、有效的芝麻油掺伪检测方法。 相似文献