首页 | 官方网站   微博 | 高级检索  
     

基于数据库垂直表示的高效用项集挖掘算法研究
引用本文:宋威,刘宇,李晋宏.基于数据库垂直表示的高效用项集挖掘算法研究[J].北方工业大学学报,2011,23(1):20-24.
作者姓名:宋威  刘宇  李晋宏
作者单位:北方工业大学信息工程学院,100144,北京;北方工业大学信息工程学院,100144,北京;北方工业大学信息工程学院,100144,北京
基金项目:国家科技支撑计划项目,北京市属市管高等学校人才强教计划资助项目,北京市优秀人才培养资助项目
摘    要:传统的频繁项集挖掘用支持度来衡量项集的重要性会丢失一些支持度不高,但效用很高、用户很可能感兴趣的模式.高效用项集能反映用户的偏好,弥补传统频繁项集挖掘的不足.本文提出了一种基于数据库垂直表示的高效用项集挖掘算法,通过执行事务支持集的交运算来找寻候选高效用项集,通过扫描一遍数据库,从候选高效用项集中发现高效用项集.本算法利用了数据库垂直表示方法存储量小、运算快的优势.实验结果表明,该算法具有较高的挖掘效率和良好的可扩展性.

关 键 词:数据挖掘  频繁项集  高效用项集

Research on High Utility Itemsets Mining Algorithm Based on Vertical Representation of Database
Song Wei,Liu Yu,Li Jinhong.Research on High Utility Itemsets Mining Algorithm Based on Vertical Representation of Database[J].Journal of North China University of Technology,2011,23(1):20-24.
Authors:Song Wei  Liu Yu  Li Jinhong
Affiliation:Song Wei Liu Yu Li Jinhong(Col.of Information Engineering,North China Univ.of Tech.,100144,Beijing,China)
Abstract:By using the traditional frequent itemset mining method to judge the importance of itemset,some low-supportivity,yet high utility and user-appealing patterns may be lost.High utility itemset which may reflect user's appeal,serves as a good compensation for the traditional one.In this paper,a high utility itemset mining algorithm based on vertical representation of database is proposed.Candidate high utility itemsets are discovered by intersection of support sets.Then,the very high utility itemsets are picke...
Keywords:data mining  frequent itemset  high utility itemset  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号