首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
为精准有效地预测电商客户粘性,提升经济效果,研究数据挖掘技术在电商客户粘性预测中的应用。利用可变网格的K-means聚类算法,聚类获取电商客户粘性预测相关数据;通过有效性指标优化可变网格K-means聚类算法的聚类数,确定最佳聚类数,提升数据聚类效果;采用技术接受模型,依据聚类获取的数据,建立电商客户粘性预测指标体系;通过模糊层次分析法,结合指标体系,建立电商客户粘性预测模型,获取预测分值。实验结果表明,该模型可有效确定最优聚类数,精准聚类电商客户粘性预测相关数据;所建立的预测指标体系的指标相关性较低,结构较稀疏、较全面。总体说明,该模型可有效预测电商客户粘性。  相似文献   

2.
为了实现智慧用电管理系统中电力客户的优化管理,需要对电力客户进行立体画像构造。提出了基于多维类别特征识别和角点标识的智慧用电管理系统中电力客户立体画像构建方法。用户画像信息跟踪采集模型,采用空间特征域分类方法进行用户画像信息分类处理。利用多尺度逐层分析方法进行模糊电力客户画像的精准定位,提取客户立体画像的用电类别特征量,采用特征域分类和分块匹配方法进行立体画像的误差修复,实现用户画像的特征快速准确定位。对提取的电力客户立体画像用电需求特征量采用支持向量机学习算法进行自适应分类,实现对智慧用电管理系统中电力客户立体画像多维构建。结果表明,采用该方法构建电力客户立体画像的特征细分能力较好,客户立体画像信息准确度高。  相似文献   

3.
随着我国旅游业发展和人们对旅游服务需求的不断增多,旅游景点的精准推荐不仅可以节约用户大量的时间,还能够提升用户的消费体验,为此本文提出一种基于情境聚类扩展用户画像的旅游景点推荐方法。基于用户情境数据进行情境聚类,构建出扩展的用户画像模型;根据群体用户画像反映的用户特征,结合情境标签设置个体用户情境特征属性,再融合关联规则和相似度计算为用户推荐个性化的景点。实验结果表明,相较于传统的关联规则Apriori推荐算法或加权Apriori推荐算法,基于情境聚类扩展用户画像的旅游景点推荐方法具有更优的推荐结果。  相似文献   

4.
客户画像是商业银行近年来的研究热点,从高维复杂的客户数据中筛选出有效属性是客户画像中的关键问题.为解决商业银行客户画像过程中,由于银行客户数据维度较高,难以实现精准画像的问题,在对客户数据进行聚类分析的基础上,结合粗糙集理论和信息熵理论,对商业银行投资客户画像属性进行了约简,并提出了属性约简算法,结果表明,该算法能够对...  相似文献   

5.
单实例多标签分类是指一个样本拥有多个标签的分类问题,对此提出了一种基于半模糊核聚类和模糊支持向量机的多标签分类算法.该算法采用一对一分解策略将多类多标签数据集分解为多个两类双标签数据子集,在每个子集上训练两类双标签模糊支持向量机.为提高分类器的性能引入了半模糊核聚类技术.实验结果表明,与现有的一些算法相比新算法具有其优...  相似文献   

6.
营销分析、客户分析和内部运营管理是企业大数据应用最广泛的3个领域。基于某市烟草零售数据,运用聚类集成算法构建客户细分模型,实现烟草零售精准营销。本算法集成了Clara算法和K-means算法,首先采用Clara算法随机生成初始聚类中心,K-means算法进行无监督学习,得到最少代价的聚类中心,然后基于零售客户基本信息进行聚类因子建模,将类别与档位进行维度交叉,对零售客户在档位内二次细分,优化迭代分配,解决烟草零售客户档位内部差异化大的问题。经多种聚类算法比较,本文方法的总误差和误差波动率小于其他单一的聚类算法。将该方法用于烟草营销投放策略,经市场验证,能够提升订足率和需求满足率。  相似文献   

7.
作为大数据环境下精准化推荐服务的有效工具,用户画像受到图书情报领域的极大关注.为将用户画像技术应用于学科服务领域,对学科用户进行了分层并设计了差异化的用户数据收集方案,融合学科服务工作内容,构建了由数据采集层、数据预处理层、标签建模层及用户画像生成层构成的4层学科用户画像模型,在此基础上,探讨并构建了包括学科用户需求精准识别层、学科用户需求精准匹配层和精准学科服务功能实现层在内的学科服务新模式,以期为实现精准化、个性化的学科服务提供借鉴.  相似文献   

8.
介绍了数据聚类算法,提出了采用基于相似度的聚类算法进行客户分类的思路,给出了相似度的计算方法及客户分类的算法,并通过试验结果证明了算法对客户分类的有效性.  相似文献   

9.
针对SMOTE算法和随机森林可较好解决不平衡数据集的分类问题但对少数类样本分类效果还有待提高的问题,融合Canopy和K-means两种聚类算法,设计了C-K-SMOTE改进算法。先后利用Canopy算法进行快速近似聚类,再利用K-means算法进行精准聚类,得到精准聚类簇,最后利用SMOTE算法增加少数类样本数量,使数据趋于平衡。选取公开数据集KEEL(knowledge extraction on evolutionary learning)数据库中的不平衡数据集,结合随机森林分类模型进行了实验验证,实验表明C-K-SMOTE算法可有效平衡不平衡数据集。  相似文献   

10.
为解决企业客户价值体现问题, 提出一种TFA客户细分改进模型, 以客户发展空间T、 购买频次F和平均购买额A为指标, 充分体现客户的价值和发展空间. 首先, 引入局部密度值ρ和信息熵H, 改进K-means聚类算法, 以优化传统K-means聚类方法初始聚类中心的选取问题;其次, 通过搭建机器学习框架, 对选取人工数据集及真实数据集进行聚类实验, 验证模型的有效性. 实验结果表明, 该模型能有效分类客户, 充分反映客户价值及其发展空间, 并通过改进聚类算法提升了算法效率.  相似文献   

11.
大数据背景下零售银行业的竞争日益加剧,根据客户的特征,将客户进行细分,为客户提供差异化的产品和服务是零售银行实现精准营销的有效途径。K-Means聚类算法是客户细分中的一种重要算法,它的基本思想是将具有更多相同特性的样本聚集到一个类中,使不同类中的样本之间尽可能的远离,而同一类中的样本之间尽可能的相近。为了提高客户细分的精度,提出一种自组织特征映射神经网络(SOM)的KMeans聚类算法(SOM-K-Means)。该算法可以解决K-Means聚类算法随机确定聚类个数和初始聚类中心等影响聚类结果准确性的问题。对某零售银行实证研究表明,SOM-K-Means聚类算法对购买某产品客户的数据进行有效的挖掘分析,根据聚类之间客户的不同特征,为不同客户群体提供个性化营销策略。  相似文献   

12.
在数据挖掘领域,聚类用于发现数据的分布模式和数据间的相互关系.作者提出一种分层聚类算法,可识大规模、高维数据.该算法首先从不同的角度对电信客户进行聚类或分类,然后以这些聚类为基础,实行自底向上的层次聚类得到最终的聚类结果.算法执行效率高,适合大规模数据的聚类问题.该方法在某电信企业的客户分析中取得了较好的结果.  相似文献   

13.
针对大学生就业问题,以层次聚类策略为技术支撑,架构出一种就业去向短期预测系统.根据待挖掘数据量,选取簇间距离度量标准,架构簇与子簇构成的层次聚类树,完成目标数据的聚类或分类处理.构建层次聚类算法模块中相关算法运行流程,结合预测系统用户与管理员的角色职责,设计多个系统数据库实体.建立各实体间关系的映射模型,基于此完成数据...  相似文献   

14.
如何聚合多维度海量数据,充分挖掘数据的内在价值,是商业银行数字化转型的重要目标之一。文章以银行个人客户支付交易数据为例,探索Textgrocery与FastText两类自然语言处理算法对交易所属场景的分类效果。实验表明,Textgrocery效果在分场景和整体方面均优于FastText,故文章最终选择Textgrocery算法对交易数据所属场景开展自动化、智能化、高效化分类。模型场景分类结果可以帮助银行为个人客户建立消费行为维度的客户标签,从而使数据资源变得可使用、有价值。  相似文献   

15.
针对标签特定特征多标签学习算法(multi-label learning with label-specific features, LIFT)未能在聚类以及分类阶段考虑标签相关性问题,提出一种基于标签相关性的标签特定特征多标签学习算法(multi-label learning with label-specific features via label correlations, LFLC).将标签空间加入特征空间进行聚类构建分类模型,采用考虑标签相关性的聚类集成技术为每个标签构造标签特定特征,使用相关性矩阵构建无向完全图并挖掘图中标签集合相关性,通过树集成表达标签间多种不同结构的强相关性.在试验部分,采用涵盖不同领域的10个数据集,以Hamming Loss、Ranking Loss、One-error、Coverage、Average Precision和macroAUC为评估指标,进行了参数敏感性分析和统计假设检验.结果表明:结合聚类集成与标签间强相关性的LFLC算法较其他对比多标签算法整体上能取得较好的效果.  相似文献   

16.
RAKEL(random k-labelsets)算法是一种集成技术,能有效解决多标签分类问题.它将原始标签集随机选用一小部分标签子集构成的数据集来训练每个分类器,但由于RAKEL算法构造标签空间的随机性,并未充分考察到样本多个标签之间的相关性,从而造成分类精度不高,泛化性能受到一定影响.为此,提出了改进的LC-RAKEL算法.首先,通过标签聚类将原始标签集划分成标签簇,再从每个标签簇中各选择一个标签构成标签集,以此发现标签空间中重要且不频繁的映射关系;然后,利用出现次数较少的标签集合组成新的训练数据,训练相应的分类器.实验证明,改进的算法性能优于其他常用多标签分类算法.  相似文献   

17.
数据聚类标签技术是在小规模样本上进行聚类,然后利用聚类结果对其余样本标注类别的方法是提高大规模数据聚类效率的一种有效途径.混合数据是现实应用中最广泛的数据类型,文章将用户兴趣数据作为小规模数据,利用K-prototypes算法对其聚类,在此基础上构建用户兴趣域.利用拟标签数据的各属性值与用户兴趣域分量的关系定义了数据关于用户兴趣域隶属度.基于用户兴趣域和"数据-用户兴趣域"隶属度的概念,提出了一种基于用户兴趣混合数据聚类标签算法UIMCL(User’s Interest Mixed Data Clustering Label).该算法克服了以往数据标签算法只能为拟标记数据指派一个类标签的局限性,可以应用于电子商务的推荐服务和用户行为分析.实验结果表明,该算法对混合数据聚类标签处理有较好的效果.  相似文献   

18.
提出一种基于C-均值聚类的二层次人像聚类算法,解决了传统硬聚类中由于每个数据只能属于某一类而使得处于类边界的数据在检索时结果准确度不高, 以及对高维大数据量数据分类时存在的模糊聚类时间和空间复杂性过大等问题. 该算法为大规模人像数据库检索提供了一种可行的分类方法, 使得分类后的人像数据在有效提高检索速度的同时保证了检索的准确度.  相似文献   

19.
对不平衡数据进行聚类分析时,K-means聚类方法可能会错误地将分布在较小区域类别中的样本划分到大区域类别中;谱聚类算法,虽然可以有效优化数据结构,并很好地识别不同形状的样本,但却难以处理大规模数据.针对这些问题,提出一种改进地标点采样的不平衡数据聚类算法.该算法首先对不平衡数据进行预聚类以获得初始类标签,然后基于数据密度对数据进行采样.在此基础上,通过对采样数据执行K-means聚类,并将聚类中心作为地标点,对数据进行谱聚类分析.实验结果显示,该方法在处理不平衡数据时,不仅能够有效提高样本的聚类准确率,而且能够保证聚类结果的稳定性和精度.  相似文献   

20.
基于粒度空间理论,进行了基于归一化距离的最小生成树分类算法研究.首先根据类内偏差和类间偏差的性质,在已有的粒度空间生成算法的基础上,引入最小生成树以及新的最优聚类指标,给出了基于归一化距离的最小生成树分类算法,并建立了最优聚类模型.其次,将模型应用于研究从NCBI上下载的1902-2015年间的898条现在已经确认能够感染人的禽流感病毒蛋白质序列HA与NA蛋白,共有8种,包括H5N1,H5N2,H7N2,H7N3,H7N7,H9N2,H10N7,以及最近的H7N9.在距离中心最近的基础上,通过运行最小生成树分类算法,6个代表病毒序列被选出,并且得到了最优层次结构.最后,对实验结果进行分析,结果表明病毒爆发地域差异、病毒爆发时间等因素对禽流感病毒的变异产生了重要影响,这些结果与已有的研究结果一致,说明本文提出的最小生成树分类算法是有效的.在寻找基于粒度空间的最佳聚类问题上,最小生成树分类算法比原有的算法具有更低的复杂度.这些结论为基于大数据的信息处理提供了一种全新的处理方法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号