首页 | 官方网站   微博 | 高级检索  
     

基于统计信息聚类边界的不平衡数据分类方法
引用本文:李欣,俞卫琴. 基于统计信息聚类边界的不平衡数据分类方法[J]. 计算机工程与设计, 2021, 42(8): 2218-2223. DOI: 10.16208/j.issn1000-7024.2021.08.017
作者姓名:李欣  俞卫琴
作者单位:上海工程技术大学数理与统计学院,上海201620
基金项目:国家自然科学基金;国家自然科学基金;全国统计科学研究项目
摘    要:为解决不平衡数据在传统处理方法中容易出现数据的过拟合和欠拟合问题,提出基于统计信息聚类边界的不平衡数据分类方法.去除数据中噪声点,根据数据对象的k距离设定邻域半径,利用对象邻域范围内的k距离统计信息寻找边界点与非边界点;将少数类中的边界点作为样本,采用SMOTE算法进行过采样,对多数类采用基于距离的欠采样删除远离边界的...

关 键 词:不平衡数据  聚类  边界点  非边界点  采样

Unbalanced data classification method based on statistical information clustering boundary
LI Xin,YU Wei-qin. Unbalanced data classification method based on statistical information clustering boundary[J]. Computer Engineering and Design, 2021, 42(8): 2218-2223. DOI: 10.16208/j.issn1000-7024.2021.08.017
Authors:LI Xin  YU Wei-qin
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号