首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 437 毫秒
1.
给出求2个字符串最长公共子串(LGS)长度的递归算法、递推算法和心动阵列算法。对2个长度分别为n,m(n≥m)的字符串,递归算法的最坏时空复杂性为(m n)!/(m!n!),而递推算法的时空复杂性分别仅为m nm 0(1),2m 0(1)。在心动阵列算法中,需m个PE和n m的时间,最后给出了一个应用实例。  相似文献   

2.
带约束最长公共子序列快速算法   总被引:2,自引:0,他引:2  
带约束最长公共子序列(CLCS)问题有很深的生物学应用背景,常被用来表示同源基因序列相似性的度量,但计算CLCS时间代价很高,最早的CLCS算法的时间复杂度为O(rn4),目前,最快的CLCS算法的时间复杂性为O(rn2).运用对偶原理将带约束最长公共子序列问题转换为带约束最小覆盖集问题,并建立带权的ref树结构,构造包含约束序列的约束覆盖子集,约简带约束覆盖子集并从中搜索关键路径,再通过关键路径构造CLCS,该算法将算法时间复杂度提升到O(nlogn+(q+r)L),r是约束序列的长度,q是两序列序偶的个数,L是两序列的最长公共子序列(LCS)长度.  相似文献   

3.
两文本动态匹配算法的改进及应用   总被引:3,自引:0,他引:3  
通过对两文本动态匹配算法(求最长公共子序列长度)的改进,降低了空间复杂度,成功地解决了字符错位问题,对常用语言实现中英文混合文本的动态匹配提出了解决方法.  相似文献   

4.
针对相似性确认步骤中编辑距离计算的高复杂性问题,提出了一种在编辑距离限制下的基于鸽笼原理的字符串相似性确认算法.首先找到满足编辑距离片段映射的片段,以此片段为基准,将长度为500bp的read分段.然后对满足编辑距离片段映射的左右部分递归地进行编辑距离计算,将各段得到的编辑距离相加即为最后结果.最后根据最长公共子串的下限将需要验证的片段数目降到最低,得到优化方案.实验结果表明,基于鸽笼原理的分段递归计算编辑距离的确认算法减少了验证步骤的时间,并能保证假阳率和假阴率都为零.  相似文献   

5.
阐述了最长公共子序列算法在程序代码结构相似度度量中的应用,列举了两种计算最优值和一种获取最长公共标识符子序列的算法.根据最优值得到结构相似度值,进而可以查找出结构相似程序对.最后探讨了程序代码相似度的实际应用.  相似文献   

6.
模式匹配算法的应用较为广泛,KMP算法是一种性能较高的算法,所以对KMP算法的深入研究能够使模式匹配问题得到较大的改善.在匹配的过程中,从模式匹配算法的子串滑动出发,解决特殊的实际问题.通过特殊子串滑动算法与KMP算法整合的实践,在一定程度上省略了KMP函数的求解过程,提高了模式匹配问题的工作效率,保证了模式匹配问题的具体划分.  相似文献   

7.
通过对两文本动态匹配算法(求最长公共子序列长度)的改进,降低了空间复杂度,成功地解决了字符错位问题,对常用语言实现中英文混合文本的动态匹配提出了解决方法.  相似文献   

8.
文章分析了BM算法及其改进算法BMHS,在此基础上提出了BM的改进算法FSBM.该算法利用当前匹配窗口的下一个字符的位置信息以及当前尝试中的已匹配子串,增大右移量,减少匹配次数,有效地加快了模式匹配的速度.  相似文献   

9.
提出了一种基于BWT(Burrows-wheeler-transform)的字符串集合的索引方法,以解决带有匹配字符串长度和匹配子串位置约束的子串确切匹配查找问题.讨论了BWT和基于BWT索引进行确切子串查找的基本原理.分析了字符串集合、匹配字符串长度和匹配子串位置约束对原BWT索引的影响.重点解决了快速地从匹配后缀位置到字符串ID和匹配子串位置的计算问题.在3个真实的数据集上进行了比对实验,结果表明:所提出的基于BWT索引方法在没有增加原索引大小的情况下,大大提升了带有匹配字符串长度和匹配位置约束的确切子串的查找的性能,因此该算法更加适用于大规模的字符串集合的索引进行近似字符串匹配和连接.  相似文献   

10.
本文提出了一个串匹配的新算法,该算法适合于当主串与子串不存在许多“部分匹配”时的情况,它是对串匹配算法中,一般算法和KMP算法的补充。  相似文献   

11.
近年来基于字的词位标注的方法极大地提高了汉语分词的性能,该方法将汉语分词转化为字的词位标注问题,借助于优秀的序列数据标注模型,基于字的词位标注汉语分词方法逐渐成为汉语分词的主要技术路线.针对一些领域文本中含有较多的英文词汇、缩写、数字等非汉字子串,提出了一种基于字和子串联合标注的汉语分词方法,该方法将子串看作和汉字等同的一个整体,采用四词位标注集,使用条件随机场模型深入研究了基于字和子串联合标注的汉语分词技术.在CIPS-SIGHAN2010汉语分词评测所提供的文学、计算机、医药、金融四个领域语料上进行了封闭测试,实验结果表明此方法比传统的字标注分词方法性能更好.  相似文献   

12.
应用遗传算法求解模糊参数的单机调度问题   总被引:1,自引:0,他引:1  
应用遗传算法求解基于可能性理论的模糊参数单机调度问题. 在单机调度问题中,作业处理时间和要求完成期限均为模糊数,而作业的权重是正的精确数. 在设计的遗传算法中,个体基因的表示采用整数排列,交叉操作使用交换子串的交叉算子,变异操作使用移动变异算子,个体评价使用基于序的评价函数. 最后用算例说明算法的有效性.  相似文献   

13.
与文本无关的话者识别一般采用高斯混合模型(GMM),而AdaBoost算法是用于提高各种现有学习算法精度的一种通用的优化算法.论文中讨论如何应用AdaBoostGMM算法进行说话人识别.  相似文献   

14.
本文结合西安市压力容器厂等企业的生产实际,提出了一种反映生产实际情况的数学模型和计算方法,进行了多方案计算。结果表明:与实际生产情况非常吻合,对企业的科学管理提供了依据。  相似文献   

15.
Flash中实现卡马克卷轴算法   总被引:1,自引:0,他引:1  
陈舒娅  温小琴 《科技信息》2010,(35):I0080-I0080,I0086
Flash开发中经常会遇到图片滚动的问题,虽然实现图片的滚动非常简单,但利用普通的方法非常消耗CPU资源。本文通过实例探讨在Flash-AS3中如何实现卡马克卷轴算法,并对算法进行测试,测试结果表明CPU消耗确有下降。  相似文献   

16.
在介绍常见博弈搜索算法的基础上,提出了简单、新颖的期望算法,并以期望算法开发Tic-Tac—Toe游戏,验证了算法的有效性、合理性。  相似文献   

17.
生产管理中一类排序问题的遗传算法   总被引:2,自引:0,他引:2  
生产定理系统中经常会遇到一系列排序问题。本文讨论将n个任务安排在m台设备上完成的一类排序问题。对该类排序问题的其他模型进行了进一步讨论,扩展了模型的适用范围,在建立通用模型的基础上,用遗传算法求解。  相似文献   

18.
K-means聚类算法是近年来数据挖掘学科的一个研究热点和重点,该算法是基于划分的聚类分析算法.目前这种算法在聚类分析中得到了广泛应用。本文将介绍K-means聚类算法的主要思想,及其优缺点。针对该算法经常陷入局部最优,以及对孤立点敏感等缺点,提出了一种基于模拟退火算法的方法对其进行优化,可以有效地防止该算法陷入局部最优的情况。  相似文献   

19.
基于纵横距离的单纯异常点检测算法及应用   总被引:1,自引:0,他引:1  
首先讨论了异常点挖掘在数据挖掘过程中的重要性,产生异常点的原因,以及目前用于检测异常点的常用算法,指出了单纯应用距离法的局限性,提出了基于纵横距离的异常点检测算法,并给出了基于学生成绩检测的应用实例,该方法不需要进行大量的样本训练,在异常点检测方面有较好的效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号