首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 281 毫秒
1.
针对通用模型对新用户行为识别准确率的问题,给出一种基于人工标签数据的模型迁移方法。对新用户采集少量带标签数据,经过带通滤波、特征提取和归一化预处理,将其加入到通用模型训练集中。对更新后的训练集进行重新训练,以所得模型与通用模型对新用户数据识别准确率的差值作为迁移必要性度量阈值,利用K-均值算法以及由底至顶的决策树子节点属性平均值替代法,对模型进行迁移。实验结果显示,与原通用模型相比,由所给方法迁移学习得到的个性化模型的识别准确率有明显提高。  相似文献   

2.
垃圾网页检测存在数据不平衡、特征空间维度较高的问题,为此,提出一种基于随机混合采样和遗传算法的集成分类算法.首先,使用随机混合采样技术,通过随机抽样,减少多数类样本数量,用少数类样本合成过采样技术方法生成少数类样本,获得多个平衡的训练数据子集;然后使用改进的遗传算法对训练数据集进行降维,得到多个具有最优特征的训练数据子集;使用极端梯度算法(XGBoost)作为分类器,训练多个平衡数据子集,用简单投票法对多个分类器进行集成,得到新的分类器;最后对测试集进行预测,得到最终预测结果.实验结果表明,提出算法的分类结果与XGBoost的结果相比,准确率提高了约19.25%,且减少了建立学习模型的时间,提高了分类性能,是一种较好的分类算法.  相似文献   

3.
简要回顾了DDoS攻击的工作原理和造成的危害,介绍了KNN和XGBoost两种机器学习算法的基本流程,提出了一种结合KNN算法和XGBoost算法的新DDoS攻击检测模型.在新模型中,通过使用KNN算法训练出模型,预测一个评分,作为新的特征加入原数据集中,再放到XGBoost中进行新一轮训练.利用标准数据集KDD CUP99进行了实验.实验数据表明,KNN和XGBoost融合模型训练和攻击检测的速度快,适用于DDoS攻击检测.  相似文献   

4.
基于全监督学习的文本分类算法需要使用大量的标签数据,而文本数据的标注任务耗时耗力且标注难度较大。针对上述问题,提出了一种基于LOTClass模型的弱监督中文短文本分类算法。首先,使用少量的标签数据构建类别种子词表;其次,使用类别种子词表指导训练中文伪标签生成模型,并使用该模型生成大量伪标签数据;最后,利用优质伪标签数据训练一个中文短文本分类模型。在THUCNews新闻标题数据集和论文标题数据集上进行实验,结果表明,该算法在仅使用少量标签数据的情况下,其性能优于主流的半监督分类算法,同时不逊于一般的全监督分类算法,为无标签数据分类任务提供了一种较好的解决方案。  相似文献   

5.
为了提高卷积神经网络训练的分类器分类准确率,往往需要大量的已标记数据,但有时已标记数据并不容易获得。针对少标记样本图像分类问题,提出基于集成GMM聚类与标签传递思想的解决方案,通过一定的规则给未标记数据赋予标签,将未标记数据转换成已标记数据用于模型的训练。在手写数字识别数据集上进行实验,结果表明新算法在少标记样本的情况下,结合集成GMM聚类的方法比只采用有标记样本训练得到的模型分类准确率有着较大提高,验证了该算法的有效性。  相似文献   

6.
随着智能手机用户数量的逐年增长,很多情景感知相关的研究也逐步开展。基于智能手机的人体行为识别已成为用户自适应感知服务中的重要研究课题。尽管有很多研究者已经尝试使用移动设备进行用户行为识别,但依旧难于从不确定的、不完整的以及不充足的移动设备传感器数据中推测出用户的行为。文中提出一种基于自动标签机制的人体行为识别模型迁移方法,利用集成学习分治思想以及深度学习网络(MLP)构建自动标签系统对新用户数据进行打标签,将打完标签的数据划归到通用模型的训练集中进行重新训练,以此完成模型迁移。实验结果表明,迁移学习后的行为识别模型能有效提高行为识别准确率。  相似文献   

7.
我国信用不良的企业数量远小于信用良好的企业数量,样本类别的极端不平衡导致传统的信用评估模型在训练时无法充分学习信用不良企业的特征. 为提高极端梯度提升算法(Extreme Gradient Boosting, XGBoost)在企业信用评估这种不平衡分类问题中的准确率,提出一种基于代价敏感XGBoost的企业信用评估模型. 在XGBoost算法拟合过程中,加入代价敏感损失函数迫使模型更加关注少数类的特征,并引入贝叶斯优化调整模型的重要超参数. 以我国A股市场中小板块企业2016—2020年数据为样本,实证结果表明,基于代价敏感XGBoost的企业信用评估模型能够在保证总体识别精度的情况下提高对信用不良企业的识别准确率.  相似文献   

8.
为提高天气图像识别的准确率,达到良好的天气图像分类效果,提出一种基于迁移学习的天气图像识别算法。该算法使用Xception图像分类算法实现网络架构,再基于迁移学习理论将模型和参数应用到天气图像识别中,并在同一数据集上与其他模型进行性能对比。实验结果表明,基于迁移学习的改进Xception模型有效解决了训练样本不足、准确率低的问题,在提高天气图像识别方面取得了较好的效果,实现了对阴天、雾天、雨天、沙尘天、雪天、晴天6类天气的识别,总识别准确率达到94.39%。  相似文献   

9.
为了提高机器学习在大数据集中的学习性能,提出了一种基于局部敏感Hash的半监督支持向量机增量学习算法.首先利用局部敏感Hash能快速查找相似数据特性的能力,筛选出第一次增量中与有标签样本相似的样本,通过TSVM(Transductive support vector machine)得到支持向量并筛选出再次增量中有可能成为支持向量的无标记样本,然后与已有支持向量和有标签样本一起作为后续训练的基础,最后使用多个数据集对算法进行验证.实验表明:提出的半监督TSVM增量学习算法能有效地提高训练学习的速度和分类准确率.  相似文献   

10.
为考虑个性化因素对热舒适的影响,建立一种基于XGBoost分类算法的热舒适预测模型.利用独热编码的方法对原始数据进行特征参数转换,将转换后的数据作为XGBoost分类算法的输入,经迭代训练后获得最佳的公共建筑中人体热舒适预测模型;利用SHAP值对模型特征参数进行解释,得出影响个性化热舒适的关键因素.结果显示:XGBoost分类算法的热舒适预测模型在受试者工作特征(ROC)曲线下的面积(AUC)和准确率分别为0.95,89%,均优于随机森林、逻辑回归、支持向量机、神经网络等算法模型,表现出较高的预测精度;影响个性化热舒适的关键因素为空气温度、相对湿度、空气风速和体重.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号