首页 | 官方网站   微博 | 高级检索  
     

数据挖掘中采样技术的研究
引用本文:郑吉平,秦小麟.数据挖掘中采样技术的研究[J].系统工程与电子技术,2005,27(11):1946-1949.
作者姓名:郑吉平  秦小麟
作者单位:南京航空航天大学信息科学与技术学院,江苏,南京,210016
基金项目:航空科学基金资助课题(02F52033)
摘    要:针对日益增长的海量数据和信息,通常采取有效的采样技术对大数据集进行采样,然后通过对样本的分析得到数据总体的相关模式。首先论述了关于样本的一些基本概念:利用采样技术对大数据集和海量数据进行分析处理,讨论了普通抽样技术与数据挖掘中的采样技术的异同。然后对目前普遍采用的采样技术进行了分类,重点研究了简单随机采样和分层随机采样,并对不同采样技术进行了比较。最后给出数据挖掘中利用采样技术的一个实现。

关 键 词:样本  简单随机采样  分层随机采样  数据挖掘  模式
文章编号:1001-506X(2005)11-1946-04
修稿时间:2004年11月14

Research on sampling technology in data mining
ZHENG Ji-ping,QIN Xiao-lin.Research on sampling technology in data mining[J].System Engineering and Electronics,2005,27(11):1946-1949.
Authors:ZHENG Ji-ping  QIN Xiao-lin
Abstract:With the rapid increase of the data and information,usually sampling technology is an effective method with very large dataset,and then the pattern of the whole dataset is obtained.First some conceptions about sample are discussed: large dataset are analyzed and processed by sampling technologies,then the difference between normal sampling technologies and sampling technologies in data mining is studied.Current prevailing sampling technologies are classified,simple random sampling technology and stratified random technology are researched,and the difference of every kind of sampling technology is concluded.In the end,an implementation of sampling technology in data mining is presented.
Keywords:sample  simple-random-sampling  stratified-random-sampling  data-mining  pattern
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号