首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
垃圾网页检测存在数据不平衡、特征空间维度较高的问题,为此,提出一种基于随机混合采样和遗传算法的集成分类算法.首先,使用随机混合采样技术,通过随机抽样,减少多数类样本数量,用少数类样本合成过采样技术方法生成少数类样本,获得多个平衡的训练数据子集;然后使用改进的遗传算法对训练数据集进行降维,得到多个具有最优特征的训练数据子集;使用极端梯度算法(XGBoost)作为分类器,训练多个平衡数据子集,用简单投票法对多个分类器进行集成,得到新的分类器;最后对测试集进行预测,得到最终预测结果.实验结果表明,提出算法的分类结果与XGBoost的结果相比,准确率提高了约19.25%,且减少了建立学习模型的时间,提高了分类性能,是一种较好的分类算法.  相似文献   

2.
简要回顾了DDoS攻击的工作原理和造成的危害,介绍了KNN和XGBoost两种机器学习算法的基本流程,提出了一种结合KNN算法和XGBoost算法的新DDoS攻击检测模型.在新模型中,通过使用KNN算法训练出模型,预测一个评分,作为新的特征加入原数据集中,再放到XGBoost中进行新一轮训练.利用标准数据集KDD CUP99进行了实验.实验数据表明,KNN和XGBoost融合模型训练和攻击检测的速度快,适用于DDoS攻击检测.  相似文献   

3.
为考虑个性化因素对热舒适的影响,建立一种基于XGBoost分类算法的热舒适预测模型.利用独热编码的方法对原始数据进行特征参数转换,将转换后的数据作为XGBoost分类算法的输入,经迭代训练后获得最佳的公共建筑中人体热舒适预测模型;利用SHAP值对模型特征参数进行解释,得出影响个性化热舒适的关键因素.结果显示:XGBoost分类算法的热舒适预测模型在受试者工作特征(ROC)曲线下的面积(AUC)和准确率分别为0.95,89%,均优于随机森林、逻辑回归、支持向量机、神经网络等算法模型,表现出较高的预测精度;影响个性化热舒适的关键因素为空气温度、相对湿度、空气风速和体重.  相似文献   

4.
为解决行波传感器传变过程中的衰变及噪声干扰等因素影响而导致的电网一、二次侧行波波形不一致问题,提出一种结合截断奇异值分解(TSVD)正则化和离散反卷积的电网故障电压行波精确检测方法。该方法选择集中参数传递函数模型构建电压行波传感器的正演模型;然后利用反卷积原理建立行波反演模型;针对行波波形反演过程中产生的病态问题,提出结合TSVD正则化理论的波形反演方法,实现电网故障电压行波的精确检测。仿真分析表明,该检测方法能够实现二次行波信号的精确反演,反演一次行波信号波形特征可以反映真实的故障波形特征。  相似文献   

5.
我国信用不良的企业数量远小于信用良好的企业数量,样本类别的极端不平衡导致传统的信用评估模型在训练时无法充分学习信用不良企业的特征. 为提高极端梯度提升算法(Extreme Gradient Boosting, XGBoost)在企业信用评估这种不平衡分类问题中的准确率,提出一种基于代价敏感XGBoost的企业信用评估模型. 在XGBoost算法拟合过程中,加入代价敏感损失函数迫使模型更加关注少数类的特征,并引入贝叶斯优化调整模型的重要超参数. 以我国A股市场中小板块企业2016—2020年数据为样本,实证结果表明,基于代价敏感XGBoost的企业信用评估模型能够在保证总体识别精度的情况下提高对信用不良企业的识别准确率.  相似文献   

6.
提出基于宽度学习系统的功能性磁共振成像(fMRI)数据分类方法,通过简单结构提取fMRI数据的深层特征,加快分类速度. 使用fMRI中感兴趣区域体素均值的时间序列构造输入数据,分别提取fMRI数据的浅层和深层特征,映射为宽度学习的特征节点和增强节点并构建模型框架,利用岭回归逆计算分类模型的连接权值,实现对fMRI数据的分类. 使用ABIDE Ⅰ、ABIDE Ⅱ和ADHD-200数据集,将所提方法与6种分类方法进行对比实验,结果表明,所提方法可以在保持良好的分类准确率的同时,大幅度降低训练时间.  相似文献   

7.
为协助高校做好招生宣传工作 ,提出了基于机器学习的高校招生网站流量预测方法 装 首先 ,对 网络日志进行预处理 ,生成不同时隙的数据集;接着 ,通过 XGBoost 模型的训练比较 ,筛选得出最佳 实验数据集;然后 ,鉴于数据的非线性和趋势不一等特点 ,分别使用参数优化后的 XGBoost 和 LSTM 模型进行数据训练 ,并根据训练误差值计算权重系数;最后 ,应用 XGB- LSTM加权组合预测模型进 行数据预测 装 实验结果表明 ,该组合模型预测结果的平均误差分别比 XGBoost 和 LSTM模型提高了 80 . 28%和3 . 42% ,具有良好的预测能力。  相似文献   

8.
传统的入侵检测机器学习算法,面对有差异的新旧数据尤其是未知的攻击行为,会出现检测准确率较低、漏检率较高的问题.为此,提出了一种将人工蜂群(ABC)算法、XGBoost模型与迁移学习相结合的ABC-XGBTrl算法.首先通过使用少量有标签的新数据训练初始分类模型,然后将有标签的旧数据中分类正确的部分与少量有标签的新数据合...  相似文献   

9.
水下环境复杂多样,使得声呐成像模糊难以人工提取特征,同时声呐图像不易获取,数量远少于光学图像,导致了小样本情况下声呐图像分类网络的训练过拟合现象明显,识别准确率低。基于所建立的声呐图像数据集进行预处理后,提出一种改进的带有类别偏好的标签平滑正则化方法,对训练数据的标签进行优化,减轻网络的自信程度,并基于迁移学习中微调的方法利用光学图像对网络参数进行预训练和冻结,融合以上方法构建了一种小样本下的分类网络模型。仿真实验结果表明,优化后的网络模型取得了最佳分类识别准确率,有效抑制了过拟合现象,能够在小样本下实现精确分类声呐图像。  相似文献   

10.
将极限梯度提升树(XGBoost)算法应用于电力系统电压稳定评估问题.根据电压稳定问题特点,提出能够反映电力系统运行状态的特征集;把电压稳定裕度绝对值作为映射目标,并介绍生成样本集的方法.在介绍XGBoost算法基本原理的基础上,研究该算法的技术细节.在IEEE-39节点系统上进行验证,结果表明,XGBoost算法在R方值和平均绝对百分误差2项回归指标上均优于其他几类机器学习算法,且模型的计算速度最快,可以满足在线应用要求.同时,XGBoost算法具有良好的数值错误和数值缺失容错性,并可以针对预测偏差较大的样本进行数据补充,实现模型的更新,使得模型表现趋于稳定.  相似文献   

11.
目前的情绪识别技术已经成功地将情绪变化与脑电信号联系起来,并在适当的刺激下从脑电信号中进行识别和分类.因为声音以及表情等信号具有一定的伪装性,而脑电信号(EEG)和情绪的变化密切相关,通过对EEG信号的分析可以更精确的反映人的情感变化.对EEG信号的研究集中于通过时域和频域的角度提取出特征信号,采用基于熵(entropy)的可分性判断进行特征选择,分别使用SVM和HMM-SVM模型两种分类方法进行情绪分类,然后对分类结果进行分析、比较.结果表明,利用HMM-SVM模型基于频域特征的分类结果最好,平均准确率为83.93%.  相似文献   

12.
将极限梯度提升树(XGBoost)算法应用于电力系统电压稳定评估问题. 根据电压稳定问题特点,提出能够反映电力系统运行状态的特征集;把电压稳定裕度绝对值作为映射目标,并介绍生成样本集的方法. 在介绍XGBoost算法基本原理的基础上,研究该算法的技术细节. 在IEEE-39节点系统上进行验证,结果表明,XGBoost算法在R方值和平均绝对百分误差2项回归指标上均优于其他几类机器学习算法,且模型的计算速度最快,可以满足在线应用要求. 同时,XGBoost算法具有良好的数值错误和数值缺失容错性,并可以针对预测偏差较大的样本进行数据补充,实现模型的更新,使得模型表现趋于稳定.  相似文献   

13.
通过分析个体出行轨迹数据,挖掘个体出行历史记忆特征以及个体所处位置与潜在目的地的距离特征,建立新的出行目的地识别模型.利用杭州市200个匿名个体62 880次出行数据测试所建模型的效果.对基于位置的服务(LBS)数据进行预处理,提取以活动为目的的分段出行数据片段,采用GeoHash网格编码方法得到网格化后的个体历史目的地集合.利用随机缺失的个体出行历史轨迹数据构建训练集和测试集,采用非线性最小二乘法对模型进行参数标定.结果表明,所建模型提升了出行目的地识别精度;对比不同模型的召回率、折扣累计收益和F1分数,所建模型优于马尔可夫模型、决策树模型以及随机森林模型;数据缺失率敏感性分析结果验证了所建模型的鲁棒性.  相似文献   

14.
提出一种基于文本分类技术的评审专家自动推荐模型,通过文本分类技术对评审专家所发表的论文进行所属学科领域的分类,进而判断出评审专家的主要研究领域。模型采用了基于TF/IDF特征权重阈值的向量空间模型算法和改进后的ATSVM分类算法。实验结果表明,改进后的ATSVM分类算法可以增加交互的过程使训练得到的分类器具备自学习的能力,改进后的主动学习SVM分类器在多类别的分类上能够精确分类并且提高分类速度。  相似文献   

15.
为了利用便携式设备准确检测老年人的跌倒状况,针对传统算法中人为设计特征造成的不完备性,构建一种基于卷积神经网络(CNN)的老年人跌倒检测模型. 以智能手机内置的三轴传感器作为数据获取源,将采集的人体姿态信息进行滤波、标准化、采样等操作后,输入到所设计的模型中;采用梯度下降和适应性动量优化方法进行多层卷积神经网络训练和优化,获得模型关键参数训练并优化模型关键参数;利用学习到的深层次特征进行样本分类. 实验结果表明:所设计的模型对于跌倒检测的准确率明显高于一般的机器学习算法模型,并且在对跌倒和非跌倒的区分检测中,精确率和召回率都保持了较高的稳定水平.  相似文献   

16.
针对病虫害分类时害虫种类多样,且类间与类内差异大等问题,提出了一种害虫分类模型PestNet.模型主要由目标定位模块OPM和多特征融合模块MFFM组成,OPM通过U型网络结构整合害虫图像浅层细节信息和深层空间信息,初步划定显著区域并输出空间语义特征.MFFM通过对空间语义特征和抽象语义特征进行双线性池化操作,弱化背景信息,增加细节特征.此外,通过目标区域裁剪和掩膜等方式辅助训练模型,提高模型分类精度.将该模型在病虫害数据集IP102上进行实验,分类准确率可达77.40%,能够实现复杂背景下大规模害虫图像的分类识别.  相似文献   

17.
针对目前传统方法无法准确快速判断系统暂态电压稳定性的问题,提出一种基于特征量和卷积神经网络(convolutional neural networks,CNN)的暂态电压稳定评估方法.首先基于传统电压稳定指标分解及响应数据,从原始电气量中进行36维电压稳定构建特征量,将特征量输入卷积神经网络中进行有监督学习,最后将训练所得到的模型应用于电力系统暂态稳定评估中.利用新英格兰10机39节点标准算例对电网进行了仿真,结果表明该方法具有错误率低、精确率高、测试时间短的特点,能够准确快速判断出系统的暂态电压失稳,提高了电力系统的稳定性.  相似文献   

18.
针对管道漏磁内检测缺陷信号的重构问题,研究了曲线拟合和最小二乘法的基本原理,以管道漏磁内检测有限元仿真分析软件所得到的半椭圆型缺陷数据为研究对象,建立了径向磁通密度特征的二元一次方程组和二元二次方程组,运用最小二乘曲线拟合方法实现对仿真数据的二元一次函数拟合和二元二次函数拟合.应用MATLAB编写程序求出拟合系数,得到拟合方程,拟合计算结果与仿真数据基本吻合.通过对两组函数方程进行误差分析,结果表明二元二次拟合函数能更准确地描绘出缺陷大小与检测数据之间的函数关系,二次拟合模型更可靠,为管道漏磁内检测缺陷信号重构提供了函数支持.  相似文献   

19.
针对短文本数据量较小情况下CNN模型无法获得较好文本分类特征造成文本分类精度不高的问题,提出一种结合BERT语义分析和CNN的短文本分类模型,通过对BERT预训练模型进行微调获得文本向量表示,文本向量能够体现文本特征的全局语义关系,并将文本向量表示数据输入CNN模型进行分类模型训练,获得最终的文本分类特征实现分类。此方法能够实现短文本分类精度的有效提升。  相似文献   

20.
为解决在法院数据信息化过程中,海量的法院文书存在缺乏自动管理分类的问题,提出一种基于字符级卷积神经网络的文本分类模型。模型通过卷积神经网络进行特征提取,能够精确有效地解决文本分类问题。实验结果证明,该模型可以实现在测试集上准确率99.67%的分类,且训练用时只有常用循环神经网络算法的50%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号