共查询到10条相似文献,搜索用时 187 毫秒
1.
关联规则发现中的聚类方法 总被引:2,自引:0,他引:2
算法MARC(Mining Association Rules using Clustering)将聚类技术应用到关联规则的发现上,MARC利用聚类技术压缩交易数据库,从而减少开采算法需要处理的数据量以提高开采效率,同时算法提出了聚类汇总转换的概念用以减轻压缩数据带来的信息丢失.在几个实际数据集上的实验表明该算法可以达到高精度和高性能. 相似文献
2.
3.
网格聚类中的边界处理技术 总被引:4,自引:0,他引:4
提出利用限制性k近邻和相对密度的概念识别网格聚类边界点的技术,给出网格聚类中的边界处理算法和带边界处理的网格聚类算法(GBCB).实验表明,聚类边界处理技术精度高,能有效地将聚类的边界点和孤立点/噪声数据分离开来.基于该边界处理技术的网格聚类算法GBCB能识别任意形状的聚类.由于它只对数据集进行一遍扫描,算法的运行时间是输入数据大小的线性函数,可扩展性好. 相似文献
4.
5.
6.
差分隐私是一种提供强大隐私保护的模型。在非交互式框架下,数据管理者可发布采用差分隐私保护技术处理的数据集供研究人员进行挖掘分析。但是在数据发布过程中需要加入大量噪声,会破坏数据可用性。因此,提出了一种基于k-prototype聚类的差分隐私混合数据发布算法。首先改进k-prototype聚类算法,按数据类型的不同,对数值型属性和分类型属性分别选用不同的属性差异度计算方法,将混合数据集中更可能相关的记录分组,从而降低差分隐私敏感度;结合聚类中心值,采用差分隐私保护技术对数据记录进行处理保护,针对数值型属性使用Laplace机制,分类型属性使用指数机制;从差分隐私的概念及组合性质两方面对该算法进行隐私分析证明。实验结果表明:该算法能够有效提高数据可用性。 相似文献
7.
Apriori算法是挖掘关联规则的经典算法.在分析该算法的基础上,在实际项目应用当中,结合SQL的特点,提出Apriori算法在SQL中的改进算法-Apriori_Sql.应用Apriori_Sql算法只需扫描一遍数据库,在数据库临时表中建立原始数据库的压缩数据映射,实验表明该算法是一种高效的关联规则的挖掘算法. 相似文献
8.
9.
10.
针对具体超市销售行业CRM进行分析,将聚类技术运用到关联规则发现领域,利用聚类技术压缩交易数据库,从而减少挖掘算法需要处理的数据量以提高挖掘效率.在企业现有数据的基础上进行实现,得到更好的挖掘效果。 相似文献