首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 109 毫秒
1.
基于信息粒度的文本聚类算法   总被引:1,自引:0,他引:1  
根据文本对象数据的高维性,稀疏性的特点,提出一种基于信息粒度原理的文本聚类方法.首先在给出文本的稀疏特征,文本的稀疏特征向量,文本的稀疏相似度,等价关系隶属度,广义的等价关系等定义的基础上,利用信息粒度原理生成初始聚类,然后提出并理论推导类间相似度的计算方法,进行类的归并.该算法聚类过程不依赖于输入样本的排列顺序,文本数据的有效压缩提高了算法的执行效率.  相似文献   

2.
为降低传统FCM算法的计算复杂性,提高Web用户聚类的效果,文中提出了一种改进的基于特征属性的Web用户模糊聚类算法。首先通过用户访问页面的次数和时间建立Web用户兴趣度矩阵,并根据商品的特征属性值将Web用户兴趣度矩阵映射为用户对特征属性的偏好矩阵,从而有效降低数据稀疏性;然后以此为数据集,对传统的FCM算法进行了改进,将聚类中心分为活动和稳定两种,忽略稳定聚类中的距离计算以降低计算复杂性。最后通过仿真实验证实了新算法的有效性和可行性。  相似文献   

3.
为降低传统 FCM 算法的计算复杂性,提高 Web 用户聚类的效果,文中提出了一种改进的基于特征属性的 Web 用户模糊聚类算法.首先通过用户访问页面的次数和时间建立 Web 用户兴趣度矩阵,并根据商品的特征属性值将 Web 用户兴趣度矩阵映射为用户对特征属性的偏好矩阵,从而有效降低数据稀疏性;然后以此为数据集,对传统的 FCM 算法进行了改进,将聚类中心分为活动和稳定两种,忽略稳定聚类中的距离计算以降低计算复杂性.最后通过仿真实验证实了新算法的有效性和可行性.  相似文献   

4.
基于属性分布相似度的超图高维聚类算法研究   总被引:4,自引:0,他引:4  
在许多聚类应用中,数据对象是具有高维、稀疏、二元的特征。传统聚类算法无法有效地处理此类数据。该文提出一种基于超图模型的高维聚类算法,通过定义对象属性分布特征向量和对象间属性分布相似度,建立超图模型,并应用超图分割法进行聚类。聚类结果通过簇内奇异特征值进行评价。实验结果和算法分析表明,该算法可以有效地进行聚类知识挖掘。  相似文献   

5.
协同过滤推荐算法使用评分数据作为学习的数据源,针对协同过滤推荐算法中存在的评分数据稀疏以及算法的可拓展性问题,提出了一种基于聚类和用户偏好的协同过滤推荐算法。为了挖掘用户的偏好,该算法引入了用户对项目类型的平均评分到评分矩阵中,并加入了基于用户自身属性的相似度;同时,为了降低数据稀疏性,该算法使用Weighted Slope One算法填充评分数据中的未评分项,并通过融入密度和距离优化初始聚类中心的K-means算法聚类填充后的评分数据中的用户,缩小了相似用户的搜索空间;最后在聚类后的数据集中使用传统的协同过滤推荐算法生成目标用户的推荐结果。通过使用MovieLens100K数据集实验证明,提出的算法对推荐效果有所改善。  相似文献   

6.
针对传统基于物品的推荐算法由于数据稀疏性导致的低推荐精度问题,提出了一种融合GMM聚类和FOA-GRNN模型的推荐算法。该算法首先使用高斯混合模型(GMM)方法对物品特征进行聚类;然后根据聚类结果分别构造评分矩阵,并使用Slope One算法填充评分矩阵;最后计算用户对物品的相似度预测评分作为输入,通过FOA-GRNN模型输出最终的评分。基于movielens-2k数据集的实验结果表明,与其他3种算法相比,该算法能够更好地处理高稀疏性数据,推荐精度更优,并能够在一定程度上解决冷启动问题。  相似文献   

7.
卢露  赵靖  魏登月 《计算机应用研究》2013,30(12):3557-3559
针对Web用户聚类时, 社会标注系统中用户访问资源数据稀疏从而导致传统聚类算法效率不高的问题, 提出了一种三向迭代聚类算法, 对用户、标签和资源分别聚类, 利用三者之间的关联关系不断相互交叉迭代调整, 直到各聚类簇达到稳定为止。实验表明, 该方法调整后类的内聚性更强, 区分度更大, 能有效解决数据稀疏性问题, 提高用户聚类效果。  相似文献   

8.
协同过滤算法可根据用户的偏好,预测其感兴趣的项目,这项技术是目前商业领域中应用较为广泛且成功的。过去,使用协同过滤算法会因其数据的稀疏性及使用K-Means算法聚类时需要预先确定聚类个数等问题影响协同过滤算法的准确性。针对上述问题,提出了一种多聚类融合的协同过滤推荐算法。首先,构建用户-项目评分矩阵;其次,根据用户兴趣、偏好矩阵查找待估值项所对应的近邻用户,随后使用Slope One算法在对每一个簇内的稀疏矩阵进行填充,从而缓解数据稀疏性问题;再次,使用Canopy聚类算法进行粗聚类,将计算出的每个中心点作为K-Means算法的初始聚类点并进行K-Means细聚类;最后,优化后的协同过滤算法最终被用来预测每个簇中填充后的评分矩阵,并采用带时间加权的相似度公式。最终实验数据显示,优化后能够有效提升算法的效率与推荐质量。  相似文献   

9.
针对网络中海量的Web服务聚类时,因其表征数据稀疏而导致使用传统建模方法所获效果不理想的问题,提出了一种基于BTM主题模型的Web服务聚类方法。该方法首先利用BTM学习整个Web服务描述文档集的隐含主题,通过推理得出每篇文档的主题分布,然后应用K Means算法对Web服务进行聚类。通过与LDA、TF IDF等方法进行对比发现,该方法在聚类纯度、熵和F Measure指标上均具有更好的效果。实验表明,该方法能够有效解决因Web服务描述所具有的短文本性质而导致的数据稀疏性问题,可显著提高服务聚类效果。  相似文献   

10.
王治和  王凌云  党辉  潘丽娜 《计算机应用》2012,32(11):3018-3022
在电子商务应用中,为了更好地了解用户的内在特征,制定有效的营销策略,提出一种基于混合概率潜在语义分析(H PLSA)模型的Web聚类算法。利用概率潜在语义分析(PLSA)技术分别对用户浏览数据、页面内容信息及内容增强型用户事务数据建立PLSA模型, 通过对数—似然函数对三个PLSA模型进行合并得到用户聚类的H PLSA模型和页面聚类的H PLSA模型。聚类分析中以潜在主题与用户、页面以及站点之间的条件概率作为相似度计算依据,聚类算法采用基于距离的k medoids 算法。设计并构建了H PLSA模型,在该模型上对Web聚类算法进行验证,表明该算法是可行的。  相似文献   

11.
传统的协同过滤算法存在数据稀疏、可扩展性弱和用户兴趣度偏移等问题,算法运行效率和预测精度偏低。针对上述问题,提出一种改进的Mini Batch K-Means时间权重推荐算法。采用Pearson相关系数改进Mini Batch K-Means聚类,利用改进的聚类算法对稀疏评分矩阵进行聚类,计算用户兴趣评分并完成对稀疏矩阵的填充。考虑用户兴趣随时间变化的影响,引入牛顿冷却时间权重计算相似度,并基于已填充评分矩阵进行相似度加权计算,得到项目最终评分。实验结果表明,与传统协同过滤算法相比,该算法的平均绝对误差下降了31.08%,准确率、召回率、F1值均有较大提升,具有较高的评分预测精确度和准确度。  相似文献   

12.
针对传统Slope One推荐算法在稀疏数据集上预测准确率较低的问题,提出一种基于图嵌入的加权Slope One算法。本文算法首先以融合时间信息的用户相似度为边权建立用户关联图,对该图进行图嵌入得到用户特征向量,然后基于Canopy聚类对用户进行类内加权Slope One推荐。另外,为优化算法性能,本文算法基于Spark计算框架实现。实验结果表明,对比传统的加权Slope One,本文算法在稀疏数据集和显式、隐式评分数据集上的推荐效果和评分预测准确率都更优。  相似文献   

13.
基于项目聚类的全局最近邻的协同过滤算法   总被引:1,自引:0,他引:1  
用户评分数据极端稀疏的情况下,传统相似性度量方法存在弊端,导致推荐系统的推荐质量急剧下降。针对 此问题,提出了一种基于项目聚类的全局最近部的协同过滤算法。该算法根据项目之间的相似性进行聚类,使得相似 性较高的项目聚成一类,在项目聚类集的基础上,计算用户的局部相似度,使用一种新的最近部用户全局相似度作为 衡量用户间相似性的标准;其次,给出了一种利用重叠度因子来调节局部相似度的方法,以更准确地刻画用户之间的 相似性。实验结果表明,该算法可以提升预测结果的准确性,提高推荐质量,特别是在数据较为稀疏时,改善尤为明 显。  相似文献   

14.
为了解决传统推荐算法使用单一模型无法准确捕获用户偏好的问题, 将稀疏线性模型作为基本推荐模型,提出了基于用户聚类的局部模型加权融合算法来实现电影的Top-N个性化推荐。同时,为了实现用户聚类,文中利用LDA主题模型和电影的文本内容信息,提出了语义层次用户特征向量的计算方法,并基于此来实现用户聚类。在豆瓣网电影数据集上的实验验证结果表明,所提局部加权融合推荐算法提升了原始基模型的推荐效果,同时又优于一些传统的经典推荐算法,从而证明了该推荐算法的有效性。  相似文献   

15.
多数聚类算法都是针对数据本身,往往忽略了用户聚类目的以及聚类过程中用户的参与指导,这样从数据本身出发的聚类结果准确性往往不太理想。针对这个问题,提出具有用户特征约束的多关系聚类算法。在多关系关联数据中进行用户参与的特征选择,用Must特征集和Can’t特征集描述用户聚类目的,通过领域本体进行特征集合扩充,得到聚类特征集合进行聚类。实验表明,该算法能较好地描述用户聚类目的,实现用户参与的聚类指导,获得了较好的聚类结果。  相似文献   

16.
协同过滤算法中存在着数据稀疏性和可扩展性问题,由于用户和项目数据量巨大致使数据十分稀疏,且不同数据集中数据存在差异,致使现有算法中的相似度计算不够准确和用户聚类效果不佳,对推荐算法准确率产生了显著影响。为了提高相似度计算和最近邻居搜索的准确率,提出了一种基于相似度优化和流形学习的协同过滤算法。通过加权因子优化相似度计算,结合流形学习对稀疏的用户评分数降维后进行谱聚类,通过获得的全局最优解提高聚类所得目标用户最近邻居的准确率,进而提高协同过滤推荐精度。在Epinions数据集和MovieLens数据集上进行实验,结果表明,提出的算法可以有效降低协同过滤算法的平均绝对误差和均方根误差,提高召回率,拥有更高的推荐准确率。  相似文献   

17.
大数据背景下,对于传统的协同过滤推荐算法在电子商务系统中的数据稀疏性、准确性不高、实时性不足等问题,提出一种改进的协同过滤推荐算法。该算法首先通过矩阵分解实现对原始数据的降维及其数据填充,并引入了时间衰减函数预处理用户评分,用项目的属性向量来表征项目,用用户的兴趣向量来表征用户,通过k-means聚类算法对用户和项目分别进行聚类;然后使用改进相似性度量方法在簇中查找用户的最近邻和项目推荐候选集,产生推荐。实验结果表明,该算法不仅可以有效解决数据稀疏和新项目带来的冷启动问题,而且还可以在多维度下反映用户的兴趣变化,推荐算法的准确度明显提升。  相似文献   

18.
协同过滤算法近年来在电子商务推荐系统中得到了广泛的应用,但该算法也存在数据稀疏性和缺乏个性化等问题,这些问题影响了推荐算法的效率和准确性。主要针对以上问题,提出引入Web日志分析的协同过滤算法,将用户对商品的隐性兴趣转化为显性兴趣,同时利用用户聚类等相关技术,不仅解决数据稀疏的问题也提高推荐的准确性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号