首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
【目的】整合多种教学资源,并在此场景下设计和实现一种高效准确的搜索策略,帮助用户获取丰富的教学内容。【应用背景】教学资源类型众多,数量庞大,用户对于准确检索的需求日益增长,仅基于ElasticSearch进行搜索的效果不尽人意。【方法】在对用户输入的Query进行预处理和分词后,通过ER-BERT语义相似度模型在Query库中匹配出n条近似结果,将其输入到ElasticSearch并构建相关度计算公式,最后按照综合评估的最终得分将匹配结果进行排序。【结果】利用知识图谱技术整合复杂的教学资源,并在此基础上实现了一种基于ElasticSearch和语义相似度匹配的教学资源搜索策略,在保证检索速度的同时可以根据用户检索Query的语义信息进行检索。【结论】实验结果表明使用该教学资源搜索策略增加了检索结果的数量,并在保证检索速度的同时提升了结果的准确性,显著改善了用户的搜索体验。  相似文献   

2.
针对现有计算机病毒特征提取算法无法有效提取未知病毒和变种病毒的特征,本文借鉴人工免疫思想,提出一种基于人工免疫结合余弦相似度的病毒特征提取算法。在代码层,算法采用TF-IDF对病毒DNA进行趋向性提取建立病毒候选基因库;在基因层,算法利用可变r匹配规则提取病毒候选基因库生产病毒检测基因库;在程序层,算法采用余弦相似度算法评估待测程序与病毒的相似度,对待测程序进行识别。经仿真实验,本算法与其他病毒特征提取算法相比,在较低虚警率的情况下有较高的病毒识别率。  相似文献   

3.
基于子树匹配的文本相似度算法   总被引:1,自引:0,他引:1  
为降低文本向量维度,提高文本间语义相似度度量性能,综合利用统计方法与语义词典的优势,提出一种文本相似度算法.基于文本生成元数据特征向量,减少向量空间维度,设计基于子树匹配的文本相似度算法,借助子树加速对文本相似度的计算,并通过将文本元数据特征向量与子树进行相似度语义匹配,提高文本相似度计算时语义相似度度量的准确性.该算法考虑到对元数据中同义词的语义理解,加强文本之间相似度度量时的语义覆盖能力.实验结果表明文中所提出的方法是可行和有效的.  相似文献   

4.
基于动态规划算法的人脸比对   总被引:1,自引:1,他引:0  
动态规划算法可以有效地用来进行序列的比对,能够给出序列之间的最优比对结果,论文将其用在人脸识别的一些关键特征的比对方面,给出了人脸之间相似程度的一种度量,同时给出了具体的算法,可以有效地应用于人脸的比对和其它进一步的人脸识别中的应用。  相似文献   

5.
医药数据相似度计算在药物信息处理中具有重要的作用。传统的文本相似度计算在医药领域并不能取得很好的效果。针对医药数据文本的特殊性,提出基于Relative-IDF的医药数据相似度计算算法。实验结果表明:相比传统TF-IDF、编辑距离等计算方法,基于Relative-IDF的医药数据相似度计算在效率和准确性上都有了很大的提升。  相似文献   

6.
基于本体概念相似度的语义Web服务匹配算法   总被引:14,自引:1,他引:14       下载免费PDF全文
通过定义本体中概念之间的语义距离来计算本体概念之间的相似度,提出一种基于该相似度的Web服务的精确匹配算法,新的算法与经典的OWL-S/UDDI匹配算法比较,不仅在等级上保持一致,而且使同一等级或不同等级之间的服务匹配都达到精确的程度。用GEIS系统中Web服务的数据进行两种算法的性能测试,得出相似度匹配算法的平均查准率是OWL-S/UDDI匹配算法的1.8倍,平均查准率是OWL-S/UDDI匹配算法的1.4倍。  相似文献   

7.
基于内容的视频检索中的一个最普遍的方法是根据给定例子视频的检索,因此视频相似度度量是基于内容检索中的一个基本问题。该文在视频签名算法基础上提出了镜头粒度上的镜头基调算法,同时为了增加匹配的准确性。提出了赋权的镜头基调,以体现基调中各帧在镜头相似度中的重要性差异,并解决了原算法可能出现的基调帧对逆序的问题。  相似文献   

8.
为了实现本体概念的自动更新,减少对领域专家的过多依赖,给出一种基于语义相似度的本体概念更新方法 SSOCUM(Semantic Similarity-based Ontology Concept Update Method)。实现一种改进的基于Word Net的相似度算法,该算法在计算路径长度的基础上,综合考虑了概念的节点深度以及信息量对相似度的影响。为了弥补基于Word Net的相似度算法没有考虑概念属性所携带的语义信息的不足,加入属性相似度对其进行调整。通过实验对比,验证了改进算法的计算结果与标准数据集之间的皮尔森系数高于传统算法,计算结果更接近于人的主观判断。采用构建好的煤矿领域通风系统本体对SSOCUM算法进行实验分析。结果表明,SSOCUM算法有助于本体新概念的自动添加,并具有一定的准确性和有效性。  相似文献   

9.
基于功能的Web服务语义相似匹配   总被引:2,自引:0,他引:2       下载免费PDF全文
任波  范菁  蔡家楣 《计算机工程》2006,32(2):206-208
Web上可获得的Web服务的日益增多引起了服务检索上新的挑战:准确定位所需的服务。该文在分析了传统关键词检索方法不足的基础上,提出基于功能的Web服务语义相似匹配,从查全率和查准率两方面对服务的检求质量进行了改进。  相似文献   

10.
Web服务发现是Web服务系统架构中重要的组成部分。传统的Web服务发现只是简单的基于关键字的语法匹配,服务的查全率和查准率有着明显的不足。本文在对概念及概念间的关系进行精确描述的基础上,对语义Web服务相似度计算方法进行了研究,提出了一种基于语义距离的Web服务匹配算法。  相似文献   

11.
为了减少传统RANSAC(Random Sample Consensus,随机抽样一致性)算法的迭代次数和运行时间,提高算法的速度和精度,提出了一种基于结构相似的RANSAC改进算法。采用BRISK(Binary Robust Invariant Scalable Keypoints)算法提取和描述二进制特征点,用Hamming距离进行特征匹配,获得初始匹配点集,利用结构相似约束剔除误匹配点,得到新的匹配点集,用新的点集作为RANSAC的输入,求出变换矩阵。该算法在初始匹配后进行了匹配点提纯,能快速求得变换模型。实验证明该算法迭代次数和运行时间比传统RANSAC算法明显减少,因此改进的算法在速度和精度上优于传统的RANSAC算法。  相似文献   

12.
DNA多序列比对是生物信息学中的最重要的任务之一。本文针对多序列比对的特点,提出一种渐进蚁群算法,即将渐进比对算法和蚁群算法相结合。在渐进蚁群算法中,既能克服蚁群算法易于陷入局部最优解、收敛速度慢的特点,又能充分发挥渐进比对算法的优点。  相似文献   

13.
程序代码相似度度量算法研究   总被引:5,自引:0,他引:5  
代码剽窃是程序设计课程中经常出现的一种作弊行为,检测剽窃的源代码,验证学生程序作业的原创性在教学中很重要.程序代码的相似度度量是剽窃检测的关键技术.通过对现有程序代码相似度度量技术进行研究后,基于Karp-Rabin和最长公共子串算法思想,提出了一种改进的源代码相似度度量算法,即串的散列值匹配算法.  相似文献   

14.
随着互联网的快速发展,信息共享的途径不断增多,高校作业雷同现象越来越多.为了解决这一问题,基于Python环境主要依赖Jieba分词库以及Gensim工具包,实现了对高校学生电子作业雷同的检测.通过对待查重文件的预处理、生成分词列表以及利用gensim工具包对工作流程进行分析,通过TF-IDF算法进行关键字提取,训练模型计算出文本相似度,并应用在实践教学里,高校教师可根据查重结果对学生针对不同的情况进行教学安排,可以培养学生独立自主完成作业的习惯,促进良好学风的建设.  相似文献   

15.
构建了一个遥感信息领域本体,基于领域本体和WordNet词典对遥感信息服务进行语义扩展,提出了一种基于本体概念相似度的遥感信息服务匹配方法,并对Leacock和Chodorow语义相似度计算模型进行改进。实验结果表明,该改进模型比距离模型和信息量模型都有提高,基于本体概念相似度的遥感信息服务匹配方法的查全率和查准率都能达到70%以上,较关键字匹配方法有显著提高。  相似文献   

16.
随着我国对地观测技术的发展,卫星遥感数据越来越多,传统空间关系数据库在时间范围、空间范围的快速查询及可扩展方面存在一定瓶颈.通过分析ElasticSearch搜索引擎框架,提出了一种基于改良GeoHash编码的时空索引方法,设计并实现了基于ElasticSearch的海量遥感数据检索技术,可以精确高效建立一维行键索引筛选遥感数据,提高查询处理效率.实验结果表明,该技术适合于组织管理与查询海量的遥感数据,查询性能优于传统关系数据库.  相似文献   

17.
通过定义本体中概念之间的语义距离来计算本体概念之间的相似度,提出一种基于该相似度的Web服务的精确匹配算法,新的算法与传统的经典匹配算法(OWL-S/UDDI算法)比较,不仅在等级上保持一致,而且使同一等级或不同等级之间的服务匹配都达到精确的程度.  相似文献   

18.
文本相似度算法研究一直是文本挖掘领域非常重要的算法,指采用一定的策略比较两个文本之间的相似程度,目前文本相似度算法已经在文本分类、文本聚类、自然语言处理等多个领域崭露头角。本文主要就语义角度出发对文本之间相似度进行界定。  相似文献   

19.
提出一种新的迭代渐进多序列比对算法IPMSA。采用公共多序列比对数据库BAIiBASE中142组蛋白质序列作为比对测试数据,并与ClustalW进行比较。比对结果的统计分析表明,IPMSA算法的比对准确率高于ClustalW。  相似文献   

20.
语义相似的PageRank改进算法   总被引:1,自引:0,他引:1       下载免费PDF全文
PageRank算法是一种用于网页排序的算法,它利用网页间的相互引用关系评价网页的重要性。但由于它只考虑网页与网页之间的链接结构,忽略了网页与主题的相关性,容易造成主题漂移现象。在分析了原PageRank算法基础上,给出了一种基于语义相似度的PageRank改进算法。该算法能够按照网页结构和网页主要内容计算出网页的PageRank值,既不会增加算法的时空复杂度,又极大地减少了“主题漂移”现象,从而提高查询效率和质量。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号