首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
为弥补属性空间聚类方法只关注对象属性信息以及结构聚类方法只关注对象间关系信息的不足,提出一种基于属性-关系综合相似度的聚类算法.在构建基于属性距离的有权网络后,算法给出对象间综合相似度以及类间综合相似度的计算方法,并设计相应策略自底向上实现聚类.与属性空间聚类和结构聚类方法相比,该算法由于兼顾了属性和关系信息而具有更高...  相似文献   

2.
吴玲玉  白尘 《计算机应用研究》2013,30(11):3283-3286
传统属性空间的密度聚类算法仅考虑对象属性取值相似度, 网络空间密度聚类算法仅关注对象间关系紧密度。针对两类算法的不足, 提出一种兼顾属性距离及关系强度的密度聚类算法。在构建兼顾属性距离及关系强度的网络之后, 完善了近邻对象及核心对象的概念, 并给出了相应的聚类策略。理论分析和实验结果表明, 由于综合考虑了属性、关系及关系强度信息, 算法规避了对象属性值分布对聚类过程的影响, 改善了聚类效果, 并能有效识别枢纽点和孤立点。  相似文献   

3.
传统的案例检索方法不能反映案例之间的内在联系,导致检索结果不够准确和全面.根据食品安全案例的特点,提出一种运用知识图谱与BERT模型相结合的案例检索方法,以提高检索效果.综合考虑食品安全案例知识图谱的关系结构和实体属性特征进行案例检索.以三元组的形式表示食品安全案例并构建知识图谱,一方面,用Jaccard相似系数计算案例的关系相似度;另一方面,采用BERT模型将属性特征向量化后,计算案例属性相似度.对两部分加权求和得到案例总相似度,并进行案例检索.多组实验验证了该方法的有效性,且案例检索结果更加准确和全面.  相似文献   

4.
李克潮  凌霄娥 《计算机应用》2013,33(10):2804-2806
针对传统推荐系统数据稀疏、相似性计算方法导致共同评分用户少的问题,提出利用云模型定性概念与定量数值转换的优势,研究云模型、用户聚类的个性化推荐改进算法。用户对项目属性评价的偏好,转换为用户对加权综合云模型表示的数字特征的偏好。利用改进的聚类算法,对评分数据、原始用户属性标准化后的信息进行聚类;同时考虑用户兴趣的变化,结合用户之间项目属性评价的综合云模型的相似度、用户对项目评分的聚类、用户属性聚类这三种方法产生的邻居用户的并集进行推荐。理论分析和实验结果表明,提出的改进算法不但解决数据稀疏性带来的共同评分用户少的弊端,即使是在新用户的情况下,仍能获得较低的平均绝对误差和平均平方误差  相似文献   

5.
随着面向网络大数据的知识库的不断出现,它们各自都包含海量的实体以及实体间的关系。然而许多有相同含义的关系并没有统一名称,针对这种情况,提出了一种基于马尔可夫聚类(Markov cluster algorithm,MCL)的实体间关系融合方法。该方法首先计算关系间的语义相似度,然后利用关系间的语义相似度作为有边的权重,构建无向图,并利用马尔可夫聚类算法进行聚类。实验表明,该方法相比层次聚类和k-means聚类方法在聚类纯度上有一定提高,并且更加方便使用。  相似文献   

6.
在移动互联环境下,依据用户行为规律对业务兴趣相似用户进行分群,可为业务准确推荐和资源有效配置提供有力支撑。因此,提出一种基于改进模糊聚类理论的用户分群算法。首先,分别定义业务兴趣相似度和业务顺序相似度,进而建立用户综合相似度指标。其次,构建基于用户综合相似度的模糊聚类模型,进而采用网格划分方法确定初始群组中心并依据平均用户隶属度调整用户群组个数,从而实现快速准确的用户分群。仿真结果验证了该算法的有效性。  相似文献   

7.
洪立印  徐蔚然 《软件》2013,(12):148-151
WAF(词激活力)是一种基于统计的描述词与词关系的算法,WAF不单纯是考虑的词之间的关联,还考虑了词前后顺序,词与词之间的距离,包含了概率和语言规则两种信息量。本文提出一种实体结构化数据的关系特征抽取算法,并基于该特征实现实体聚类。首先提取出实体结构化数据的语义和语境特征,以此来文本建模,然后对每个属性基于WAF值进行相似度计算,最后进行实体聚类。  相似文献   

8.
为了解决推荐算法中无法挖掘用户深层兴趣偏好,从而导致提取准确度低下,以及相似用户聚类准确率低下时间复杂度高等问题,提出评论量化模型优化差分进化的聚类优化推荐算法(MT-QRPD)。首先利用BiGRU网络的特征时序性与CNN的强局部特征有效性联合提取评论深度特征,并利用多头注意力机制的多维语义特征筛选对评论进行深度语义特征挖掘;然后经过多层感知机非线性转换进行多特征融合完成准确量化;最后使用PCA对差分进化变异选择进行优化完成相似用户聚类优化操作,寻找相似用户完成项目推荐。通过多项实验分析表明,所提推荐算法在量化评分准确度、时间复杂度以及推荐性能上都有较好的提升。  相似文献   

9.
针对传统协同过滤推荐算法没有充分考虑用户属性及项目类别划分等因素对相似度计算产生的影响,存在数据稀疏性,从而导致推荐准确度不高的问题.提出一种基于用户属性聚类与项目划分的协同过滤推荐算法,算法对推荐准确度有重要影响的相似度计算进行了充分考虑.先对用户采用聚类算法以用户身份属性聚类,进而再对项目进行类别划分,在相似度计算中增加类别相似度,考虑共同评分用户数通过加权系数进行综合相似度计算,最后结合平均相似度,采用阈值法综合得出最近邻.实验结果表明,所提算法能够有效提高推荐精度,为用户提供更准确的推荐项目.  相似文献   

10.
为提高云制造服务的聚类质量,提出一种融合多维属性相似度的云制造服务谱聚类算法。将云制造服务的文本型属性值向量化和数值型属性值归一化,分别构建文本型属性相似度矩阵和数值型属性相似度矩阵。设计一种属性相似度融合函数,实现多维度云制造服务属性相似度的融合,建立云制造服务相似度矩阵。引入相似矩阵的本征间隙确定聚类个数,实现高效、精准的云制造服务谱聚类。实验结果表明,该方法较其它聚类方法显著提高了云制造服务的聚类质量。  相似文献   

11.
针对面实体匹配问题进行了研究。面实体的边界线在某点的拱高正是对边界线在该点的弯曲程度和凸凹性的反映,该点的中心距离又可以对面实体形状的整体进行描述,通过边界线上某点的中心距离和拱高组成复数,并对其进行快速傅里叶变换可以获取傅里叶形状描述子,作为对面实体形状相似度的度量。将面实体的空间位置、形状、大小等相似度通过加权综合,获得了一种综合空间相似度度量模型,利用此模型对面实体进行匹配。实验结果表明,算法能够有效地进行面实体的匹配。  相似文献   

12.
针对心理医学领域文本段落冗长、数据稀疏、知识散乱且规范性差的问题, 提出一种基于多层级特征抽取能力预训练模型(MFE-BERT)与前向神经网络注意力机制(FNNAttention)的心理医学知识图谱构建方法. MFE-BERT在BERT模型基础上将其内部所有Encoder层特征进行合并输出, 以获取包含更多语义的特征向量, 同时对两复合模型采用FNNAttention机制强化词级关系, 解决长文本段落语义稀释问题. 在自建的心理医学数据集中, 设计MFE-BERT-BiLSTM-FNNAttention-CRF和MFE-BERT-CNN-FNNAttention复合神经网络模型分别进行心理医学实体识别和实体关系抽取, 实体识别F1值达到93.91%, 实体关系抽精确率达到了89.29%, 通过融合文本相似度与语义相似度方法进行实体对齐, 将所整理的数据存储在Neo4j图数据库中, 构建出一个含有3652个实体, 2396条关系的心理医学知识图谱. 实验结果表明, 在MFE-BERT模型与FNNAttention机制的基础上构建心理医学知识图谱切实可行, 提出的改进模型所搭建的心理医学知识图谱可以更好地应用于心理医学信息管理中, 为心理医学数据分析提供参考.  相似文献   

13.
目的 多尺度空间关系一致性评价是多尺度空间数据冲突检测或数据匹配的重要环节,现有方法主要集中于相同或相近比例尺空间关系的相似性计算,对尺度跨度较大、发生维度变化情形的一致性评价考虑较少,且定性的概念距离度量方法难以适用于具有维度差异的多尺度空间数据。针对上述问题,提出一种顾及降维的多尺度空间关系广义一致性度量方法。方法 首先,引入同名对象概念,分析多尺度范畴下同名对象的表现特征。考虑到维度变化对空间关系的影响,结合并扩展已有的空间关系度量方法,分别提出了广义的拓扑关系、方向关系、距离关系相似性度量方法。然后,构建小尺度场景的同名对象邻近关系图,为减少一致性计算代价,依据不同空间关系特点将邻近关系图化简为各类空间关系邻近图。最后,通过依次计算各类空间关系的相似性值和联合相似性值来判断多尺度场景空间关系表达的一致性。结果 通过对1:1万基础地理数据和1:5万派生数据进行空间关系相似性的定量计算分析,并与现有概念距离方法进行比较,验证了本文方法能更精确地度量尺度跨度较大的空间关系一致性。结论 该评价方法具有广泛适用性,可用于辅助地图综合、多尺度空间数据匹配以及多尺度空间数据建库等过程。  相似文献   

14.
针对旅游信息呈现出散乱、无序和关联性不强的问题,提出一种融合BERT-WWM(BERT with whole word masking)和指针网络的实体关系联合抽取模型构建旅游知识图谱。借助BERT-WWM预训练语言模型从爬取的旅游评论中获得含有先验语义知识的句子编码。针对传统的实体关系抽取方法存在错误传播、实体冗余、交互缺失等问题,以及旅游评论中的实体关系存在一词多义、关系重叠等特征,提出直接对三元组建模,利用句子编码抽取头实体,根据关系类别抽取尾实体,并建立级联结构和指针网络解码输出三元组。基于Neo4j图数据库存储三元组构建旅游知识图谱。实验在建立的旅游数据集上进行,融合BERT-WWM与指针网络的实体关系联合抽取模型的准确率、召回率和F1值分别为93.42%、86.59%和89.88%,与现有模型相比三项指标均显示出优越性,验证了该方法进行实体关系联合抽取的有效性。构建的旅游知识图谱实现了旅游景区信息的整合与存储,对进一步促进旅游业发展具有一定的实际参考意义。  相似文献   

15.
实体消歧作为自然语言处理的关键问题,旨在将文本中出现的歧义实体指称映射到知识库中的目标实体。针对现有方法存在仅实现单实体指称消歧、忽略了实体影响力及候选实体间相似度对消歧结果的影响以及冗余图节点增加图计算复杂性等问题,提出了一种融合多特征图及实体影响力的领域实体消歧方法,以金融领域为例,提取CN-Dbpedia中金融类别相关关键词三元组,构建金融领域知识库;针对金融活动类文本,提取待消歧实体指称,融合字符串及语义的相似特征,筛选出候选实体,利用知识库三元组信息获取候选实体间2-hop内的关系,同时计算候选实体间相似度作为边权值,进而将多特征信息充分融合到图模型当中,完成多特征图构建;采用动态决策策略,利用PageRank算法,并结合实体影响力计算多特征图中候选实体的综合评分,进而获得可信度较高的消歧结果。实验结果验证了提出方法在特定领域实体消歧的精确度及效率。  相似文献   

16.
流程相似度的计算在企业业务流程管理中具有重要作用。目前相似度的计算主要存在两个问题:一是大多数相似度计算方法只考虑模型结构或事件日志,导致算法不够精确;二是综合考虑了模型结构和事件日志的算法复杂度高且效率低。因此,提出了一种改进的流程模型结构和事件日志相结合的方法。首先将流程模型结构中的紧邻活动转化为邻接矩阵,然后根据事件日志中的行为信息对邻接矩阵进行加权得到加权邻接矩阵,最后采用符合距离度量特性的矩阵间距离的算法来度量流程间相似度。通过实验与MDS、GED以及WBPG等算法进行对比,所提方法的准确率更高,为99.51%,计算效率也更高。  相似文献   

17.
传统多维度文本聚类一般是从文本内容中提取特征,而很少考虑数据中用户与文本的交互信息(如:点赞、转发、评论、关注、引用等行为信息),且传统的多维度文本聚类主要是将多个空间维度线性结合,没能深入考虑每个维度中属性间的关系。为有效利用与文本相关的用户行为信息,提出一种结合用户行为信息的多维度文本聚类模型(MTCUBC)。根据文本间的相似性在不同空间上应该保持一致的原则,该模型将用户行为信息作为文本内容聚类的约束来调节相似度,然后结合度量学习方法来改善文本间的距离,从而提高聚类效果。通过实验表明,与线性结合的多维度聚类相比,MTCUBC模型在高维稀疏数据中表现出明显的优势。  相似文献   

18.
活动社交网络(EBSNs)为用户提供了方便的组织、参加和分享社交活动的平台。该文面向EBSNs活动推荐问题,提出了包含活动(Event)、主办方(Sponsor)和用户(User)的ESU图模型,深入揭示了EBSNs的实体及其社交关系。因为用户参加活动受多个因素影响,我们提出了基于ESU图的活动推荐多因素决策模型,包括社交影响力、活动内容、活动地点及活动时间。根据ESU图特点,提出了基于双向重启随机游走算法BD-RWR的实体重要度计算方法。选取真实的EBSNs平台—豆瓣同城验证所提方法的有效性。实验结果表明,该文提出的ESU图模型及融合了多因素的活动推荐模型,与已有最新方法相比,有效地提升了用户参加活动的推荐效果。  相似文献   

19.
传统协同过滤推荐算法的相似度量方法仅考虑用户间共同评分,忽略了用户间潜在共同评分项等信息量对推荐结果的影响。针对上述问题,设计了一种正态分布函数相似度量模型,此模型考虑了用户间的共同评分、共同评分项目数、以及用户的评分值,据此提出了融合正态分布函数相似度的协同过滤算法,该算法通过综合多种评分因素利用正态分布函数和修正的余弦相似度共同度量用户间的相似关系。实验结果表明,在两种数据集上与几种不同的推荐算法相比,该算法的相似度量方法提高了目标用户查找邻近用户集合的准确率,提高了系统的推荐质量。  相似文献   

20.
常伟鹏  袁泉 《计算机仿真》2021,38(1):331-335
对网络信息实体进行关联匹配,能够更好的实现网络数据的传递和分析。由于网络数据呈现多源异构,以及非均匀分布等特征,导致难以对其信息实体进行准确快速的关联匹配。由此,提出了融合多模式匹配的网络信息实体关联策略。策略考虑了网络信息实体的复杂性与动态性,首先设计了语法相似性,对大量简单信息实体进行快速匹配;然后基于深度与距离设计了语义相似性,对实体中包含的词干与复合词汇进行准确匹配;再利用数据类型建立类型相似性,对缺失信息的实体进行匹配;最后通过编辑距离与惩戒函数,设计了结构性相似度,对实体之间上下文依赖与约束进行匹配。根据实验结果,验证了融合多模式匹配的网络信息实体关联策略具有灵敏的区分能力,并且在匹配准确度和匹配效率上均取得了显著的性能优化效果,能够有效应对网络信息实体的异构与分布特性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号