首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
传统教学资源推荐方法无法处理大量过载信息且质量参差不齐,因此文章研究基于相似度算法的中国建筑史线上课程教学资源推荐方法。首先将兴趣与教学资源的相似度和知识之间连接度融合,构建线上教学资源推荐模型;其次利用信息检索与数据挖掘加权技术,完成相似度算法的增加和文本特征权重的计算;最后通过Apriori算法挖掘用户置信度,与用户相似度进行融合后,完成线上课程教学资源的推荐。测试结果表明:教学资源推荐方法增加相似度算法后,完成教学资源推荐的平均用时为14.8 s,平均准确率也可以达到99.431%,提高了教学资源推荐质量。  相似文献   

2.
社会标签系统是Web2.0中提出的新概念,旨在更好地表达用户的兴趣和意愿。标签聚类是社会标签数据挖掘中一个非常重要的研究课题。标签相似度的计算是标签聚类的关键技术。主要工作包括:(1)提出了一种基于TF-IDF的标签相似度计算方法和基于该相似度的聚类算法;(2)分析了影响标签相似度的条件;(3)通过实验表明:与已有方法相比,新方法的准确性更高。  相似文献   

3.
在社会化标记系统中,常采用聚类等数据挖掘技术来解决标签冗余和语意模糊的问题.现有标签聚类算法大多根据不同标签在对象中共同出现的次数来计算它们之间的相似度,但是这种方法聚类的精确度与召回率并不高.针对此问题,提出一种新的标签聚类算法,充分考虑标签的标记信息,采用基于对象的特征向量来精确地表征一个标签,根据余弦相似度公式得到较为准确的标签相似度,然后采用K-Means算法将用户标签进行聚类.实验结果表明该算法能够得到更加精确的聚类结果.  相似文献   

4.
时间序列相似度是时间序列数据挖掘的重要研究方向之一。如何利用时间序列相似度对提高时间序列数据聚类有着重要的意义。提出一种基于时间序列相似度的半监督谱聚类算法,通过选取适当的时间序列特征构造相似度与距离,在谱聚类算法的基础上利用标签数据选取初始类簇。实验表明,该算法使具有相似特征的时间序列可以很有效地被聚集到同一类中。  相似文献   

5.
在社会网络中,标签聚类研究可以解决标签冗余和语义模糊等问题。为了提高聚类有效性,提出综合标签共现信息确定标签特征向量,通过特征向量的提取计算相似度,将传统聚类算法中用几何距离计算对象与中心对象的距离改为用皮尔森相关系数计算,提出结合K-means聚类算法对标签进行聚类的标签共现聚类算法,并分析了算法的复杂度。最后对不同聚类算法进行了相关对比实验,实验结果表明该聚类算法效果要好于其他的聚类算法,从而验证了该聚类算法的有效性和可行性。  相似文献   

6.
个人微博在事件提取上大多都是运用文本进行相似度计算最终达到聚类结果,而没有充分的考虑到微博特征。针对微博标签、URL、时间等特征,提出一种基于微博特征的事件提取算法。该算法针对微博的特征进行TF-IDF的改进,并加入标签相似度,URL相似度,进行综合相似度计算,最后按时间先分段后合并的改进K-means聚类方法得出事件提取结果。实验结果表明,基于微博特征的事件提取算法对微博关键字提取和事件提取的精确度有明显的提高。  相似文献   

7.
孙成霞 《信息与电脑》2023,(22):217-219
为了改善工商管理线上教学资源的个性化推荐效果,提出基于知识图谱的工商管理线上教学资源个性化推荐方法。首先,通过构建工商管理线上教学资源的知识图谱,获取教学资源知识点和实体之间的关系。其次,利用用户兴趣与教学资源的相似度计算,判断资源与用户学习偏好的匹配情况。最后,根据结果推荐适合用户需求的教学资源。实验结果表明,该个性化推荐方法在召回率和推荐准确性方面具有优势。  相似文献   

8.
不确定树模式聚类是数据挖掘领域中的一个重要问题,提出了一种新的不确定树模式聚类算法,有效地解决了因数据的不确定性而导致的无法聚类的问题.为了更加准确地度量树模式之间的相似性,提出了一种语义相似度计算方法与结构相似度计算方法.设计了一个动态聚类过程,自适应获取聚类阈值,较大程度上减少了人为干扰导致聚类结果不准确的影响,使得具有相似结构的子树聚集在同一个相似分组中,不同分组之间的子树相似度达到最小化.通过模拟数据和真实环境两部分实验表明,算法有效可行,聚类结果较准确且具有较好的运行效率.  相似文献   

9.
传统的推荐算法多以用户评分数据计算用户的兴趣偏好以及资源相似度,对稀疏数据以及新用户的推荐质量较低。考虑到用户标签数据的随意性和语义模糊性,提出基于标签网络分割聚类的语义规范化方法并建立基于规范化标签的用户兴趣模型。该模型能在不改变用户兴趣的前提下有效降低用户标签兴趣模型的向量维数,并能避免分析标签语义的复杂过程,且能根据用户自身的理解来获取用户兴趣。最后将标签兴趣模型应用到推荐算法中。通过与经典的推荐算法进行比较,验证了该算法能有效缓解数据稀疏性、推荐冷启动问题,提升了推荐结果的准确性,能获得更好的推荐效果。  相似文献   

10.
加权聚类分析在设备运行监控中的应用   总被引:3,自引:0,他引:3  
论文采用数据挖掘中的聚类分析算法对流程企业的大量而正常的历史数据进行分析,首先采用基于欧几里德距离的加权K-means算法建立了参数的聚类模型,然后用相关系数法计算每个簇团中的参数和中心参数的相似度,得到了相似度阈值。以此为基础,可以对设备的运行状况进行监控,从而起到设备运行优化和故障预警的作用。  相似文献   

11.
传统基于项目的协同过滤算法在计算项目相似度时仅依靠评分数据,未考虑项目的自身特征。社会化标注的出现使得标签能在一定程度上反映项目特征,但标签具有语义模糊的特点,因此直接将标签纳入协同过滤算法存在一定问题。为解决上述问题,提出一种改进的基于项目的协同过滤推荐算法。该算法对标签进行聚类并生成主题标签簇,根据项目标注情况计算项目与主题间的相关度并生成项目-主题相关度矩阵,同时将其与项目-评分矩阵相结合来计算项目间的相似度,采用协同过滤完成对目标项目的评分预测,以实现个性化推荐。在Movielens数据集上的实验结果表明,该算法能够解决标签的语义模糊问题并提升推荐质量。  相似文献   

12.
针对传统协同过滤推荐算法中由于相似度计算导致推荐精度不足的问题,提出一种基于标签权重相似度量方法的协同过滤推荐算法。首先,通过改进当前算法中标签权重的计算,并构成用户-标签权重矩阵和物品-标签权重矩阵;其次,考虑到推荐系统是以用户为中心进行推荐,继而通过构建用户-物品关联矩阵来获取用户对物品最准确的评价和需求;最后,根据用户-物品的二部图,利用物质扩散算法计算基于标签权重的用户间相似度,并为目标用户生成推荐列表。实验结果表明,与一种基于"用户-项目-用户兴趣标签图"的协同好友推荐算法(UITGCF)相比,在稀疏度环境为0.1时该算法的召回率、准确率和F1值分别提高了14.69%、9.44%、17.23%。当推荐项目数量为10时,三个指标分别提高了17.99%、8.98%、16.27%。结果表明基于标签权重的协同过滤推荐算法可有效提高推荐结果。  相似文献   

13.
近年来很多基于协同过滤的推荐系统得到了成功应用,但随着系统中用户和项目数量的不断增加,相似度计算量剧增,使得协同过滤推荐系统的扩展性问题变得日益突出。本文提出改进的基于近似最近邻的LSH/MinHash算法,并运用到图书馆资源聚类中,以解决在合理时间复杂度下的高维大数据量聚类问题,降低相似度计算量,提高算法的可扩展性。实验表明此算法有较高的效率与精度。  相似文献   

14.
思政教育可以体现中国特色社会主义本质要求,因此研究基于K-Means聚类的思政教育资源个性化推荐方法。首先,根据两组相邻用户之间的共同喜好,划分思政教育资源个性化推荐等级。其次,选择协同过滤算法归一化样本数据,计算相似度制定用户偏好,构建思政教育资源推荐模型。最后,基于K-Means聚类算法给定目标函数,建立个性化推荐流程,实现思政教育资源推荐,完成方法设计。实践表明,该方法既能够满足思政教育资源的匹配,又能够保证用户对思政教育资源的喜爱程度,具有实际的应用效果。  相似文献   

15.
推荐系统通常利用商品属性、用户信息以及用户对商品的已有评分来获取用户或者商品之间的相似度,进而预测未知评分。构造了关于这些信息的四部图,然后根据图中不同部分的组合获得了10类推荐算法,并比较了它们的时间复杂度。前两类算法基于用户与商品之间的关系,为经典的协同过滤算法。中间4类算法以用户或商品为中心,利用相应的标签信息进行相似度的计算并预测评分。后4类算法为中间4类算法的部分拓展,进一步考虑了评分信息。以MAE(mean absolute error)和RMSE(root-mean-square error)为评价指标,在两个Movie Lens数据集上的测试结果表明,商品之间的相似度比用户之间的相似度更可靠,商品标签也比用户标签更有用,而且某些信息的简单线性组合可以提高推荐质量。  相似文献   

16.
轨迹聚类是城市交通数据挖掘的重点之一,交通轨迹聚类算法是按照一定的相似度指标将轨迹划分成若干个类簇。在复杂的路网环境下,针对目前如DTW、SDTW等相似度计算方法准确性不高的问题进行了研究,提出了一种划时区分段的动态时间规整算法(SDTW+)进行相似度计算。该算法充分考虑了轨迹形状因素,能有效提高准确性。实验部分利用不同相似度算法,并结合层次聚类算法对实际车辆轨迹进行聚类,最终以平均轮廓系数和聚类成功率为评价指标,判断不同相似度算法的聚类效果。试验结果表明,采用所提算法相对于采用DTW、SDTW的平均轮廓系数分别提高33.86%,12.94%,同时聚类成功率也得到一定提高。  相似文献   

17.
针对目前协同过滤推荐算法的推荐质量和推荐效率低的问题,提出了一种基于改进蜂群K-means聚类模型的协同过滤推荐算法。首先,根据用户属性信息,采用改进蜂群K-means算法对用户进行聚类,建立用户聚类模型;然后,计算目标用户与用户聚类模型中各聚类中心的距离,其中距离最近的类为目标用户的检索空间;最后,从检索空间中依据用户-项目评分矩阵通过相似度计算搜索目标用户的最近邻居,由最近邻居的信息产生推荐列表。实验结果表明,该算法降低了平均绝对误差值,缩短了运行时间,提高了推荐质量和推荐效率。  相似文献   

18.
针对传统协同过滤推荐算法没有充分考虑用户属性及项目类别划分等因素对相似度计算产生的影响,存在数据稀疏性,从而导致推荐准确度不高的问题.提出一种基于用户属性聚类与项目划分的协同过滤推荐算法,算法对推荐准确度有重要影响的相似度计算进行了充分考虑.先对用户采用聚类算法以用户身份属性聚类,进而再对项目进行类别划分,在相似度计算中增加类别相似度,考虑共同评分用户数通过加权系数进行综合相似度计算,最后结合平均相似度,采用阈值法综合得出最近邻.实验结果表明,所提算法能够有效提高推荐精度,为用户提供更准确的推荐项目.  相似文献   

19.
经典竞争聚集( CA)算法在聚类时对于样本中的少量已知信息没有加以利用,但这些信息往往需要应用到整个聚类过程中。此外,在相似度度量函数的选择上CA算法使用常见的欧氏距离,然而欧氏距离仅适用于团状数据,制约了算法的应用范围。针对上述问题,通过引入具备半监督学习能力的半监督项对隶属度矩阵进行增强,利用聚类中心和中心邻近的点组成空间,把样本点与该空间的距离替代欧氏距离作为新的相似度度量标准,并给出判断聚类中心能否合并的阈值参数,最终得到半监督空间化CA算法。通过在人造图像和真实图像上的分割结果表明,该算法能够更准确地获取聚类类别数以及更好的聚类效果。  相似文献   

20.
以密度敏感距离作为相似性测度,结合近邻传播聚类算法和谱聚类算法,提出了一种密度敏感的层次化聚类算法。算法以密度敏感距离为相似度,多次应用近邻传播算法在数据集中选取一些“可能的类代表点”;用谱聚类算法将“可能的类代表点”再聚类得到“最终的类代表点”;每个数据点根据其类代表点的类标签信息找到自己的类标签。实验结果表明,该算法在处理时间、内存占用率和聚类错误率上都优于传统的近邻传播算法和谱聚类算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号