期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	2篇
免费	0篇
国内免费	2篇

学科分类

工业技术

4篇

出版年

2023年	1篇
2022年	2篇
2021年	1篇

排序方式： 共有4条查询结果，搜索用时 15 毫秒

不平衡数据中基于权重的边界混合采样

姜新盈江开忠严涛王舒梵《计算机工程与设计》2022,43(5):1265-1272

针对单一的不平衡数据分类算法合成样本质量不佳、未考虑类内样本分布等局限性,提出一种不平衡数据中基于权重的边界混合采样(boundary mixed sampling based on weight selection in imbalanced data,BWBMS)。剔除噪声样本并引入边界因子概念,把原样本空间分成边界集和非边界集;考虑类内样本分布,对于边界集中每个少数类样本赋予支持度权重和密度权重并增加采样比重将其划分为两类,对两类样本子集采用不同的过采样算法和过采样倍率;考虑不同区域样本重要性的不同,根据多数类样本距离其最近的k个异类近邻的平均距离来删减部分非边界集多数类样本点。实验结果表明,结合SVM分类器的BWBMS算法在不同数据集上的性能指标得到了提升,验证了其有效性。相似文献

谱聚类欠取样下自编码网络不平衡数据挖掘

王舒梵严涛姜新盈《计算机系统应用》2021,30(10):331-335

不平衡数据集的应用领域日益广泛,需求也越来越高,为提升整体数据集的分类准确率,以谱聚类欠取样为前提条件,构建一种自编码网络不平衡数据挖掘方法.把聚类问题转换成无向图多路径划分问题,通过无向图与标准化处理完成谱聚类,经过有选择地欠取样处理多数类数据集,获取分类边界偏移量,利用学习过程是无监督学习的自编码网络,升、降维数据,获取各维度隐藏特征,实现各层面的数据高效表示学习,根据最大均值差异与预设阈值的对比结果,调整自编码网络,基于得到的分类界面,完成不平衡数据挖掘.选用具有不同实际应用背景的UCI数据集,从中抽取10组数据作为测试集,经谱聚类欠取样处理与模拟实验,发现所提方法大幅提升少数类分类精度与整体挖掘性能,具有较好的适用性与可行性. 相似文献

基于层次密度聚类的去噪自适应混合采样

姜新盈王舒梵严涛《计算机系统应用》2022,31(10):206-210

针对非平衡数据存在的类内不平衡、噪声、生成样本覆盖面小等问题, 提出了基于层次密度聚类的去噪自适应混合采样算法(adaptive denoising hybrid sampling algorithm based on hierarchical density clustering, ADHSBHD). 首先引入HDBSCAN聚类算法, 将少数类和多数类分别聚类, 将全局离群点和局部离群点的交集视为噪声集, 在剔除噪声样本之后对原数据集进行处理, 其次, 根据少数类样本中每簇的平均距离, 采用覆盖面更广的采样方法自适应合成新样本, 最后删除一部分多数类样本集中的对分类贡献小的点, 使数据集均衡. ADHSBHD算法在7个真实数据集上进行评估, 结果证明了其有效性. 相似文献

基于高斯混合聚类采样的不平衡数据处理方法

严涛江开忠姜新盈王舒梵《计算机应用与软件》2023,(12):305-311

在处理不平衡数据时，为有效剔除多数样本内的冗余信息和合成有价值的少数样本，提出一种基于高斯混合模型的采样算法(MSGMM)。将多数类和少数类样本分别聚类，最佳聚类个数通过迭代确定。在迭代时，先初步选择聚类个数并用高斯混合模型聚类。对于多数样本的每一个聚类C的剔除比例为其聚类中心到SVM生成超平面的距离权重和其数量权重的加权；对少数类样本按聚类中心到超平面的距离来划分采样比例；并用Random-SMOTE算法合成新样本，以此达到样本数量之间的平衡。实验表明该算法相较于传统算法，精度有1%～16%的提升，验证了该算法的有效性。相似文献