首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 203 毫秒
1.
针对客户流失预测任务中,离散特征进行one-hot编码后特征空间过大,特征表示向量过于稀疏,引发维度灾难的问题,提出一种流失预测模型。基于特征嵌入和Transformer将高维离散数据转换为基于上下文的嵌入,降低编码后的数据维度,增强特征值间的联系。结合基于自适应邻接矩阵定义的图卷积操作,自动学习特征间潜在的关联关系,提高对正类样本的识别精度。使用交叉验证的方式在两份公开数据集上进行对比实验和消融实验,实验结果表明,改进模型能够有效增强多层感知机对于样本的拟合能力,提高分类预测准确率。  相似文献   

2.
针对在线学习过程中出现的知识过载及传统推荐算法中存在的数据稀疏和冷启动问题,提出了一种基于多层感知机(MLP)的改进型深度神经网络学习资源推荐算法。该算法利用多层感知机对非线性数据处理的优势,将学习者特征和学习资源特征进行向量相乘的预测方式转换为输入多层感知机的方式,改进了DN-CBR神经网络推荐模型。为验证模型的有效性,以爱课程在线学习平台数据为样本构建数据集,通过对比实验表明,在该数据集上,改进后模型相较于DN-CBR模型在归一化折损累积增益和命中率指标上分别提升了1.2%和3%,有效地提高了模型的推荐性能。  相似文献   

3.
针对推荐算法中的数据稀疏性和冷启动问题,提出了基于卷积神经网络的结合时间特征的协同过滤深度推荐算法(CNN-deep recommend algorithm with time,C-DRAWT)与基于多层感知机的结合时间特征的协同过滤深度推荐算法(MLP-deep recommend algorithm with time,M-DRAWT)。算法进行数据预处理,利用二进制来编码用户与项目的信息,缓解了one-hot编码的书籍稀疏性问题。提取出用户与项目的隐藏特征,将用户和项目的特征融合时间戳特征,分别输入到优化后的卷积神经网络和多层感知机进行,得到最新时刻的推荐项目。两个算法经过基于MovieLens-1M数据集的对比实验验证,得到的F1-Score值平均提高了0.78%,RMSE值平均提高了2.7%。结果表明,该方法能够缓解数据稀疏性和冷启动问题,相比较于之前的模型具有较好的推荐效果。  相似文献   

4.
研究电信客户流失问题,电信客户流失数据具有模糊性和非线性,单一算法仅能对模糊性或非线性进行预测,为提高电信客户流失估计准确率,提出了一种电信客户流失组合估计模型.首先对客户属性进行清洗并进行离散化处理,接着使用粗糙集方法对离散属性进行约简,刻画电信客户流失数据的模糊性;然后遗传算法优化支持向量机对电信客流失非线性进行描述,建立电信客户流失估计模型.仿真结果表明,粗糙集与支持向量机相融合模型克服单一粗糙集算法或支持向量机存在的缺陷,提高电信客户流失估计模型的估计准确率,可为电信客户管理优化设计提供依据.  相似文献   

5.
在信用评估问题中,用户信息中既包含类别数据,也包含数值数据。传统的基于人工智能的信用评估模型通常对类别数据进行one-hot变换后,再与数值数据进行拼接作为判别器的输入。与之不同,借鉴了自然语言处理中的词嵌入技术来提取类别数据的词向量;将输入的词向量集合类比为“句子”,并基于自注意力机制从“句子”中提取出用户特征;最后采用多层感知机来预测用户违约的概率。新模型可以使用反向传播算法实现端到端的训练。在三个不同的数据集上将新模型和六种基准算法进行了比较,结果表明该模型能够比基准算法取得更好的性能。  相似文献   

6.
针对纺织行业客户流失问题建立了基于支持向量机的预测模型。基于该行业预测客户流失指标属性多、相关系数高的特点,首先采用主成分分析法从多指标属性中筛选出客户流失的主要因素,有效地降低了支持向量机的训练维度。通过实际纺织行业的客户数据集测试,与普通支持向量机及其他传统预测模型进行比较,验证该模型具有良好的推广能力以及更高的精确性。  相似文献   

7.
基于深度学习的自动编码器是替代传统通信发射器和接收器的一种新方法。提出了一种基于卷积神经网络(Convolutional Neural Network, CNN)和门递归单元(Gate Recurrent Unit, GRU)的自动编码器,集成了星座映射和信道编码功能。设计了一种并行CNN结构,并将输入比特流进行分段的one-hot编码。这样做有两个优点:(1)与不分段的one-hot编码相比,数据的维度降低了;(2)数据的稀疏性降低,这使网络可以更快更好地收敛。此外,引入GRU以实现信道编码。所提出的模型可以应用于高阶调制如4096QAM信号,在加性高斯白噪声(AWGN)信道和瑞利信道下都有着优于传统方法的性能。  相似文献   

8.
周传华  于猜  鲁勇 《计算机应用研究》2021,38(4):1058-1061,1068
针对个性化推荐中用户评分矩阵数据集稀疏,用户和项目描述信息未充分利用的问题,提出融合评分矩阵和评论文本的深度神经网络推荐模型(deep neural network recommendation model,DeepRec)。首先将通过数据预处理得到的用户偏好特征和项目属性特征的文本集合分别输入到卷积神经网络进行训练,得到用户和项目的深层次非线性特征,同时将评分矩阵输入多层感知机得到用户偏好隐表示,并对两种模型提取的用户偏好隐表示进行融合;其次利用多层感知机建模用户和项目隐表示对用户进行个性化推荐;最后基于三组数据集以均方根误差为评估指标进行对比实验。结果表明DeepRec的预测误差更低,有效提高了推荐的精准度。  相似文献   

9.
非数值化特征经常出现在数据中,对其有效编码是采用机器学习模型解决问题的关键。针对目前被广泛使用的one-hot编码方法的编码结果具有较大的稀疏性,并且编码出的数值仍然没有明确的物理意义等问题,提出一种基于条件概率的区域划分编码算法CZT(conditional-probability-based zone transformation coding)。该方法首先对特征进行条件概率计算,并依据条件概率划分特征区域,按照区域内的联合条件概率进行编码;然后将CZT编码算法与one-hot算法进行对比分析,从理论上推导并证明CZT编码对特征的压缩率至少为每个特征取值空间的平均大小,同时证明经过CZT编码后的问题具有更简单的优化目标形式,有利于设计后续机器学习算法;最后通过采用相同结构的神经网络进行分类,在Titanic数据集下对比CZT算法和one-hot算法编码数据后对分类器性能的影响,结果表明CZT编码的数据的分类准确率和稳定性均有提升。  相似文献   

10.
徐兵  弋沛玉  王金策  彭舰 《计算机科学》2021,48(z2):244-250
针对推荐系统存在的数据稀疏问题,传统的协同过滤方法无法捕捉辅助信息之间的相关性,从而降低了推荐的准确度,文中提出KGE-CF模型,引入了知识图谱作为辅助信息,利用知识图谱中多源结构性的数据来缓解数据稀疏问题.KGE-CF结合多层感知机捕获高阶非线性特征的能力,能够学习出用户与项目更深层次的交互信息,从而提升推荐质量.首先,KGE-CF模型将用户的历史交互项目与知识图谱中的实体进行映射,并且利用知识图谱的翻译模型进行训练,得到实体嵌入向量与关系向量,并依据"兴趣迁移"思想进一步学习出更为丰富的用户向量;然后,模型将学习得到的用户向量与项目向量拼接,作为多层感知机的输入,捕捉用户与项目之间的高阶特征信息;最后,通过一个sigmoid函数得到用户对候选项目的偏好程度.通过在真实数据集上的实验,证明了提出的KGE-CF模型在点击率预测和top-k两种推荐场景下均优于其他方法.  相似文献   

11.
针对数据挖掘方法在电信客户流失预测中的局限性,提出将信息融合与数据挖掘相结合,分别从数据层、特征层、决策层构建客户流失预测模型。确定客户流失预测指标;根据客户样本在特征空间分布的差异性对客户进行划分,得到不同特征的客户群;不同客户群采用不同算法构建客户流失预测模型,再通过人工蚁群算法求得模型融合权重,将各模型的预测结果加权得到预测最终结果。实验结果表明,基于信息融合的客户流失预测模型确实比传统模型更优。  相似文献   

12.
针对于大样本数据的客户流失预测,从特征有效表达的角度,提出了一种基于谱回归特征约简的预测模型.模型在原始客户特征基础上,利用基于谱回归的流形降维,建立可区分性的低维特征空间,在此之上采用支持向量机实现客户流失的二分类.通过在网络客户和传统电信客户两种不同数据集上的大样本实验,并与不同分类器、不同特征约简或选择方法的对比,证明了该方法的有效性.  相似文献   

13.
基于代价敏感SVM的电信客户流失预测研究*   总被引:3,自引:0,他引:3  
针对客户流失数据集的非平衡性问题和错分代价的差异性问题,将代价敏感学习应用于Veropoulos提出的采用不同惩罚系数的支持向量机,建立客户流失预测模型,对实际的电信客户流失数据进行验证。通过与传统SVM、C4.5和ANN对比研究,结果显示此方法在精确度、命中率、覆盖率和提升度均有所改善,表明此方法有效地解决了数据集的非平衡性和错分代价问题,是进行客户流失预测的有效方法。  相似文献   

14.
随着移动互联网的广泛普及,国内网络游戏市场日趋饱和,游戏公司获得新用户的成本不断增加,如何预防存量用户的流失已经成为市场营销的重心。提出了一种基于Spark平台的网络游戏用户流失预测方法,基于一个真实游戏日志数据对用户进行了流失预测。首先,从日志数据中抽取和计算了用户特征;随后,按权重选取了一组重要特征;最后,以特征为输入、流失与否为输出进行了二分类建模。综合比较了随机森林、支持向量机、多层感知机、梯度提升决策树和逻辑回归等6种常见分类算法。实验结果表明,随机森林算法表现最优,模型预测精度达到91%。  相似文献   

15.
客户流失管理是电信运营商通过对客户需求满意度调查进行有针对性挽留客户的一个重要方法,其中最关键的就是对客户流失行为做出预测。提出了一种基于神经网络的客户流失预测模型。根据行业专家经验值选取分析变量,通过神经网络计算分析变量的权值,建立客户流失预测模型并对客户流失趋势进行预测。该方法与决策树和贝叶斯网络等算法相比,通过使用两次神经网络,从原始数据上千个属性中提炼出与客户流失度相关性较大的属性,分析出的影响流失属性更利于下一步的客户挽留工作。  相似文献   

16.
为了提高铁路零散白货客户流失预测的准确性和高效性,根据铁路零散白货客户的流失特征,提出了基于CDL模型的客户流失识别方法,在此基础上,针对数据量大的问题,提出了基于Hadoop并行框架的C4.5决策树客户流失预测模型。通过仿真实验,证明该模型具有较好的准确性和预测能力,并且随着样本数量的增加,Hadoop并行框架的效率得到了明显的提升,且不影响客户流失预测模型的准确性和预测能力。  相似文献   

17.
针对智能商业平台中的大数据预测问题,提出一种多因素稀疏回归预测模型。以离散余弦变换为基础,构建包含多个外部因素(节假日、天气、温度)的字典集,通过LASSO方法定量求解稀疏编码模型中各外部因素的影响。实验对2 000个商家的客流量进行预测。实验结果表明,外部因素不同程度地影响客流量,在预测模型中叠加外部因素后可以有效提高预测的准确性。同时,与其他方法对比表明,多因素稀疏回归预测模型比RNN、ARIMA 等模型的预测效果更好。  相似文献   

18.
由于电信市场竞争日益激烈,为了保持客户,防止客户流失,提升企业的竞争力,利用DBSCAN算法对流失客户群数据进行划分,分析客户流失原因,结合决策树ID3算法进行客户流失预测,实验结果表明,两种算法的结合,使得客户流失预测准确率得到较大提高.  相似文献   

19.
Several studies have demonstrated the superior performance of ensemble classification algorithms, whereby multiple member classifiers are combined into one aggregated and powerful classification model, over single models. In this paper, two rotation-based ensemble classifiers are proposed as modeling techniques for customer churn prediction. In Rotation Forests, feature extraction is applied to feature subsets in order to rotate the input data for training base classifiers, while RotBoost combines Rotation Forest with AdaBoost. In an experimental validation based on data sets from four real-life customer churn prediction projects, Rotation Forest and RotBoost are compared to a set of well-known benchmark classifiers. Moreover, variations of Rotation Forest and RotBoost are compared, implementing three alternative feature extraction algorithms: principal component analysis (PCA), independent component analysis (ICA) and sparse random projections (SRP). The performance of rotation-based ensemble classifier is found to depend upon: (i) the performance criterion used to measure classification performance, and (ii) the implemented feature extraction algorithm. In terms of accuracy, RotBoost outperforms Rotation Forest, but none of the considered variations offers a clear advantage over the benchmark algorithms. However, in terms of AUC and top-decile lift, results clearly demonstrate the competitive performance of Rotation Forests compared to the benchmark algorithms. Moreover, ICA-based Rotation Forests outperform all other considered classifiers and are therefore recommended as a well-suited alternative classification technique for the prediction of customer churn that allows for improved marketing decision making.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号