首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
基于聚类协作过滤的个性推荐系统的实现   总被引:1,自引:0,他引:1  
根据目前电子商务网站中商品个性化推荐的现状.本文提出时不同的商品可分别根据商品间的相似性和顾客间的相似性进行聚类和协作推荐.并具体给出基于聚类协作过滤的商品个性化推荐的流程、系统设计和系统实现.  相似文献   

2.
商品的个性化推荐是电子商务个性化服务中非常重要的一个方面,而聚类协作过滤则是推荐系统中采用最为广泛的技术。在基于聚类协作过滤的商品个性化推荐中的聚类算法通常采用划分聚类,文章根据电子商务网站的特点,提出了用改进的Rock层次凝聚算法Improved-Rock实现基于购买商品类别相似性的用户聚类。模拟实验结果表明该算法的应用是有实际价值的。  相似文献   

3.
商品的个性化推荐是电子商务个性化服务中非常重要的一个方面,而聚类协作过滤则是推荐系统中采用最为广泛的技术。在基于聚类协作过滤的商品个性化推荐中的聚类算法通常采用划分聚类,文章根据电子商务网站的特点,提出了用改进的Rock层次凝聚算法Improved-Rock实现基于购买商品类别相似性的用户聚类。模拟实验结果表明该算法的应用是有实际价值的。  相似文献   

4.
顾客作为产品满意度测度过程中评价决策的主体,对其进行分类研究,识别不同顾客群体异质评价特征具有重要意义。顾客评价特征存在多元性和冲突性,根本原因是顾客作为决策者的异质性,而顾客的异质性来源于顾客本身属性,包含分类型属性和数值型属性。提出了一种基于惩罚竞争机制的混合属性顾客分类方法,根据数值型和分类型属性值的分布规律,给出了混合数据初始聚类中心的确定方法;建立了统一相似性度量模型,并引入惩罚竞争机制,实现了聚类过程中的基本迭代和自动优化聚类数。以某产品异质顾客分类问题为例验证了所提方法的可行性,继而通过“Heart Disease”标准数据集将所提算法与K-means和K-prototypes两种经典聚类算法进行对比,验证了该方法的有效性。  相似文献   

5.
李林 《计算机应用研究》2012,29(11):4097-4100
分析网络群落划分的GN聚类和模式识别中AP聚类两种算法的设计思想和特点;以图书借阅记录为例构建了顾客聚类的数据集,进行了两种算法的聚类比较。研究表明,两种算法从不同角度揭示了顾客群体的结构特征,GN聚类结果与顾客的宏观特征分类相接近,而AP算法结果反映出顾客需求的分布特征。探讨了算法设计原则对实验结果产生的影响。这些工作可为聚类算法的设计改进和顾客行为的数据挖掘等研究提供一定的参考。  相似文献   

6.
在电子商务环境下,如何按照顾客的购买兴趣进行聚类分析并为其提供个性化服务,是电子商务应用中研究的热点课题之一时.顾客的浏览行为及兴趣进行了研究,提出了利用偏好度的方法来度量顾客的兴趣度,在此基础上给出了基于偏好的客户群聚类算法.在该算法中,依据Web日志数据计算顾客偏好度,建立偏好度矩阵,再利用模糊聚类方法对顾客进行聚类.并用实例说明了具体的聚类过程.  相似文献   

7.
基于整体和局部相似性的序列聚类算法   总被引:1,自引:0,他引:1  
戴东波  汤春蕾  熊赟 《软件学报》2010,21(4):702-717
现有的很多序列聚类算法是基于“局部特征可以表征整个序列”的假设来进行的,即不区分实际应用中序列的整体相似性和局部相似性.这对存在保守子模式的序列,如DNA和蛋白质序列是适用的,但对一些注重整体序列相似性的应用领域,如:在交易数据库中用户购买行为的比较,时间序列数据中全局模式的匹配等,由于难以产生频繁子模式,用基于全局相似性的度量方法进行聚类显得更为合理.此外,在基于局部相似性的序列聚类算法中,选取的局部子模式表征序列的能力也有待进一步提高.由此,针对不同应用领域,分别提出基于整体相似性的序列聚类算法GSClu和基于局部相似性的序列聚类算法LSClu.GSClu和LSClu分别利用带剪枝策略的二分k均值算法和基于有gap约束的强区分度子模式方法对各自领域的序列数据进行聚类.实验采用交易序列数据和蛋白质序列数据,实验结果表明,GSClu和LSClu对各自领域的序列数据具有较快的处理速度和良好的聚类质量.  相似文献   

8.
陆林花 《计算机仿真》2009,26(7):122-125,158
为了在聚类数不明确的情况下实现聚类分析,提出一种新的结合最近邻聚类和遗传算法的动态聚类算法.新算法包括两个阶段:第一阶段用最近邻聚类算法根据最近邻方法把最相似的实例分到同一个簇中并根据一些相似性或相异性度量过滤掉噪声数据从而得到初始聚类集,第二阶段是遗传优化阶段,利用动态聚类评估函数,动态地合并初始聚类集,从而获得接近最优的解.最后对算法进行了实验仿真,实验结果表明方法在事先不知道聚类数的情况下能够有效地进行聚类.  相似文献   

9.
Web页面和客户群体的模糊聚类算法   总被引:17,自引:0,他引:17  
web日志挖掘在电子商务和个性化web等方面有着广泛的应用.文章介绍了一种web页面和客户群体的模糊聚类算法.在该算法中,首先根据客户对Web站点的浏览情况分别建立Web页面和客户的模糊集,在此基础上根据Max—Min模糊相似性度量规则构造相应的模糊相似矩阵,然后根据模糊相似矩阵直接进行聚类.实验结果表明该算法是有效的.  相似文献   

10.
对分别采用欧氏距离和网络距离作为相似性测度的聚类方法进行分析,并从空间网络中对象间着手,提出一种具有方向特点的网络对象聚类算法.算法利用空间网络的邻接关系,将两种距离结合起来作为聚类的相似性测度以提高聚类的精度.算法分析和实验证明,该算法的聚类效果优于单一度量的聚类方法.  相似文献   

11.
郭炜  何丕廉  王中 《计算机应用》2006,26(8):1996-1997
利用标准化客户数据,确定了聚类相似度公式和评价指标,使用层次凝聚方法和K-平均算法实现了客户的自动聚类;并且在权衡算法效率和聚类精度的基础之上提出了改进的聚类距离公式和K-平均算法,达到了较好效果。  相似文献   

12.
基于遗传算法的顾客购买行为特征提取   总被引:2,自引:0,他引:2  
提出一种基于遗传算法的顾客行为特征提取算法。首先,采用Tanimoto 相似度来度量顾客间购买行为,并设计遗传聚类算法对顾客群体进行划分,把具有相似购买行为顾客聚集为一类。然后,针对不同顾客群体的购买行为特征,设计一种基于遗传算法的多种群特征提取方法,从各个子群体中发现顾客的购买行为的知识。为了增强种群内部协同进化能力和规则质量,我们采用最近邻替代遗传策略和局部搜索策略。使用实际零售数据集对整个算法进行验证,并与经典的Apriori算法进行比较。实验结果表明该算法在不需要产生频繁项集的情况下,可较高效生成精简规则集,在规则形式方面也更加灵活。最后,对实验结果进行详细分析。  相似文献   

13.
李展  彭进业  温超 《计算机科学》2011,38(7):235-239
多示例学习中,包由多个示例组成,有明确标记,而示例标记却不确定。已有聚类研究都针对单示例、单标记,因而无法直接应用于多示例问题。基于推土机距离(earth mover's distance, EMD)提出了一种新的多示例聚类算法ECMIL。该方法首先利用欧式距离计算包内示例相似度,将相似示例合并;然后将需要度量距离相似性的包内示例分别看作供货者和消费者,计算货物拥有量和货物需求量;对推土机距离无法供货问题,通过增大满足条件供货者的权值加以解决;最后使用k-mcdoids算法进行聚类。在基准数据集MUSK, Corcl和SIVAI上进行实验,表明EC-MIL算法是有效的。  相似文献   

14.
矩阵聚类法是一种对于给定稀疏二值矩阵求其相关指定面积和密集度的方法。在客户关系管理领域里作为一种数据挖掘技术,矩阵聚类法可以将相关客户和信息聚集成簇。在Apriori算法基础上加以改进提出一种新的矩阵聚类算法来获取满足具体指定条件的所有子矩阵。结果表明新算法能够具体细节地对客户的采购信息加以分析。  相似文献   

15.
彭昂  王如龙  陈泉泉  张锦 《计算机应用》2010,30(7):1930-1932
针对电信客户的有效细分问题,利用属性相似度度量思想,提出了一种面向复杂属性的聚类算法。该算法用复杂属性分布相似度函数衡量对象的相似性,然后根据相似性建立图模型,最后对图进行分割进行聚类。相比于传统基于选维和降维的聚类分析算法,提出的算法能有效处理高维数据和复杂属性。同时,算法在参数调节时,不需遍历原始数据,也减少了人工干预。利用真实电信客户数据进行的模拟实验也表明,提出的算法具有良好性能,可以有效解决电信客户细分问题。  相似文献   

16.
在移动互联环境下,依据用户行为规律对业务兴趣相似用户进行分群,可为业务准确推荐和资源有效配置提供有力支撑。因此,提出一种基于改进模糊聚类理论的用户分群算法。首先,分别定义业务兴趣相似度和业务顺序相似度,进而建立用户综合相似度指标。其次,构建基于用户综合相似度的模糊聚类模型,进而采用网格划分方法确定初始群组中心并依据平均用户隶属度调整用户群组个数,从而实现快速准确的用户分群。仿真结果验证了该算法的有效性。  相似文献   

17.
Unsupervised feature selection is an important problem, especially for high‐dimensional data. However, until now, it has been scarcely studied and the existing algorithms cannot provide satisfying performance. Thus, in this paper, we propose a new unsupervised feature selection algorithm using similarity‐based feature clustering, Feature Selection‐based Feature Clustering (FSFC). FSFC removes redundant features according to the results of feature clustering based on feature similarity. First, it clusters the features according to their similarity. A new feature clustering algorithm is proposed, which overcomes the shortcomings of K‐means. Second, it selects a representative feature from each cluster, which contains most interesting information of features in the cluster. The efficiency and effectiveness of FSFC are tested upon real‐world data sets and compared with two representative unsupervised feature selection algorithms, Feature Selection Using Similarity (FSUS) and Multi‐Cluster‐based Feature Selection (MCFS) in terms of runtime, feature compression ratio, and the clustering results of K‐means. The results show that FSFC can not only reduce the feature space in less time, but also significantly improve the clustering performance of K‐means.  相似文献   

18.
针对传统的谱聚类算法通常利用高斯核函数作为相似性度量,且单纯以距离决定相似性不能充分表现原始数据中固有的模糊性、不确定性和复杂性,导致聚类性能降低的问题。提出了一种公理化模糊共享近邻自适应谱聚类算法,首先结合公理化模糊集理论提出了一种模糊相似性度量方法,利用识别特征来衡量更合适的数据成对相似性,然后采用共享近邻的方法发现密集区域样本点分布的结构和密度信息,并且根据每个点所处领域的稠密程度自动调节参数σ,从而生成更强大的亲和矩阵,进一步提高聚类准确率。实验表明,相较于距离谱聚类、自适应谱聚类、模糊聚类方法和地标点谱聚类,所提算法有着更好的聚类性能。  相似文献   

19.
一种基于群体智能的客户行为分析算法   总被引:33,自引:0,他引:33  
提出了一种基于群体智能的客户行为分析算法.首先将客户的消费模式作为平面上的一个点随机分布于平面区域内;然后依据基于群体智能的聚类方法,选用由小到大的群体相似系数进行聚类分析;最后,在平面区域内采用递归算法收集聚类结果,获得不同消费特征的客户群体.文中还提出了算法的并行策略,提高了算法对大数据量的适应性.该文以电信移动客户话费数据作为实验数据,并将算法结果与其它经典聚类算法的结果进行比较分析.分析结果表明:这种基于群体智能的客户行为分析算法能够满足客户聚类和分类的要求,特别是在大客户分析及一对一营销中特别客户的分析方面该算法有直观、类别特征明显等特点.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号