共查询到20条相似文献,搜索用时 31 毫秒
1.
伴随生物测序技术的不断发展,大量基因组片段的后续处理问题亟待解决.基因组片段填充是有效解决方法之一,受到广泛关注.基于普通序列的单面基因组片段填充问题是将缺失的基因序列填充到一个不完整基因组片段B中,得到B′,与完整的参考基因组A对比,使得A和B′之间的邻接数最大化.基于片段重叠群的该问题区别在于基因组片段通常由一组连续的片段重叠群(contig)构成,缺失基因只能在contig两端进行插入.针对这两个领域的相关问题进行深入研究,对已有算法及算法复杂性进行详细的分析与比较,为未来基因组片段填充问题的研究及生物测序技术的发展提供有价值的参考. 相似文献
2.
3.
王继强 《计算机工程与设计》2010,31(20)
为有效解决生物信息学中的基因组断点median问题,针对4个以上环形基因组的一般情形,建立了该问题的图模型.鉴于基因组断点median问题自身的NP-困难性,从问题转化的角度,将其等价地化为图上的旅行商问题(TSP),找出二者之间最优解的关系,进而给出了其p-近似算法,其中p为用于求解TSP问题的近似算法的近似比.对算法的复杂度和近似比进行了分析,基于LINGO软件的算例表明了该算法的可行性和有效性. 相似文献
4.
因实际生产中调度问题的规模很大,分析其近似算法的绝对性能比很难,有时甚至不可行,所以研究近似算法的渐近性能比就很有必要,本文针对多机Flowshop加权完成时间调度问题,使用单机松弛和概率分析方法,证明了基于加权最短处理时间需求的启发式算法是渐近最优的. 相似文献
5.
当前的不完整数据处理算法填充缺失值时,精度低下。针对这个问题,提出一种基于CFS聚类和改进的自动编码模型的不完整数据填充算法。利用CFS聚类算法对不完整数据集进行聚类,对降噪自动编码模型进行改进,根据聚类结果,利用改进的自动编码模型对缺失数据进行填充。为了使得CFS聚类算法能够对不完整数据集进行聚类,提出一种部分距离策略,用于度量不完整数据对象之间的距离。实验结果表明提出的算法能够有效填充缺失数据。 相似文献
6.
设施定位问题即UFL问题是NP-hard的组合优化问题,是聚类问题领域的热点问题之一,在数据挖掘和分类识别方面有着重要应用.多年来其近似算法研究一直是计算机科学工作者关注的焦点,然而现有研究结果大多关于Metric空间,一般距离空间中该问题结果始终未见.针对最大连接费用至多是最小连接费用ω>1倍的一般距离空间中设施定位问题,简称一般设施定位问题,借助集合覆盖问题,利用问题归约方法证明其不存在近似性能比小于1.243 0.316ln(ω-1)的多项式时间近似算法,除非NPDTIME(nO(log log n));设计了一般设施定位问题的局部搜索算法,证明算法近似性能比是(1 ω)/α,ω>1,1≤α≤2.仿真实验表明,一般设施定位问题局部搜索算法的求解质量极高;通过实验进一步研究了该算法并给出了改进方法. 相似文献
7.
主要研究双层无线传感网络模型,即数据信息流只能在传感器和中继器或中继器和中继器之间传输,而不能在传感器之间传输。近似算法基于两个子问题:k圆盘覆盖问题和单层传感网络的k连通问题,而后在部分中继器周围设置“等六边形”结构的中继器点,最终达到整个网络的3-连通水平。该算法的最终性能比为8α+β,其中α为k圆盘覆盖近似算法的性能比,β为单层传感网络的k连通近似算法的性能比。 相似文献
8.
一种改进的求解TSP问题的近似算法 总被引:1,自引:0,他引:1
旅行商问题(TSP)是典型的具有NPC复杂性的组合优化问题。在现有求解TSP问题的2-近似算法closest-point算法基础上,通过对插入点的插入位置进行改进,提出了一种有效的近似算法最近点前后插入法(CPBOA),并采用TSPLIB中的一些典型实例对该算法进行了测试,同时与典型的常数近似比算法MST-PRIM算法和closest-point算法进行了比较。实验结果表明,该算法在求解质量上与closest-point和MST-PRIM算法相比都有很大的改进,而且速度也很快。 相似文献
9.
随机柔性Flow shop加权完成时间调度问题的启发式策略性能分析 总被引:1,自引:0,他引:1
因实际生产中调度问题的规模很大,分析其近似算法的绝对性能比很难,有时甚至不可能,所以研究近似算法的渐近性能比就很有必要.本文针对随机柔性Flow shop加权完成时间调度问题,使用单机松弛和概率分析方法,证明了基于加权最短期望处理时间需求的启发式策略是渐近最优的. 相似文献
10.
11.
多染色体基因组进化问题中常见的重组事件就是移位(translocation),对此已有很多研究成果.但事实上更为普遍的情况是2个基因组包含不同基因,这需要考虑插入和删除事件.对于"通过移位-插入-删除进行基因组排序(简称SG-TID)"这个问题,此前已有一个求解移位-删除(或者移位-插入)序列的近似算法,以及求解SG-TID问题的启发式算法.在给出了移位-插入-删除距离的表达公式后,给出了在增加O(n)存储空间的条件下,O(n2)时间内求解该问题的精确算法.该算法比此前给出的算法要快. 相似文献
12.
k-Median近似计算复杂度与局部搜索近似算法分析 总被引:4,自引:0,他引:4
k-Median问题的近似算法研究一直是计算机科学工作者关注的焦点,现有研究结果大多是关于欧式空间和Metric空间的,一般距离空间k-Median的结果多年来一直未见.考虑一般距离空间k-Median问题,设dmax/dmin表示k-Median实例中与客户点邻接的最长边长比最短边长的最大者.首先证明dmax/dmin≤ω+ε+(的k-Median问题不存在近似度小于1+ω-1/e的多项式时间近似算法,除非,由此推出Metric k-Median问题不可近似到1+2/e,除非NP(∈)DTME(NOlog logn)).然后给出k-Median问题的一个局部搜索算法,分析表明,若有dmax/dmin≤ω,则算法的近似度为1+ω-1/2.该结果亦适用于Metric k-Median,ω≤5时,局部搜索算法求解Metric k-Median的近似度为3,好于现有结果3+2/P.通过计算机实验,进一步研究了k-Median局部搜索求解算法的实际计算效果和该算法的改进方法. 相似文献
13.
不完整大数据的分布式聚类填充算法 总被引:2,自引:0,他引:2
传统大数据填充算法是根据整个数据集对缺失数据进行填充,使得填充值容易受到不同类别数据的干扰,导致填充结果不精确。针对该问题,给出不完整数据的相似度度量方法,使用近邻传播( AP )算法对不完整数据进行聚类。采用云计算技术优化AP聚类算法,实现一种基于MapReduce的分布式聚类算法,根据算法聚类结果将同一类数据对象划分到相同簇中,并利用同一类对象的属性值对缺失值进行填充。实验结果表明,该算法能实现不完整大数据的聚类,同时加快聚类速度,提高缺失数据的填充精度。 相似文献
14.
块移动是基因重组的一种重要形式.短块移动是将排列中的元素最多移动到偏离原来两个位置的块移动.Heath和Vergara最先给出短块移动排序近似度为4/3的多项式时间算法.本文设计了近似性能比为14/11的短块移动排序新算法.首先讨论了具有伞形结构排列图的子排列的排序方法,并将这种子排列称为‘伞’,设计了特殊子排列伞短块移动排序的多项式时间精确算法.然后给出关联伞子排列短块移动排序的贪心算法.讨论了5种特殊子排列的短块移动排序方法,证明了它们短块移动距离的新下界,从而证明此贪心算法的近似性能比为14/11,这是目前解答短块移动排序问题近似性能比最小的多项式近似算法. 相似文献
15.
16.
k-median问题的近似算法研究一直是计算机科学工作者关注的焦点。基于均衡限制条件,利用反向贪心策略,给出求解该问题的随机近似算法。证明该算法以较大的概率满足其近似性能比的期望值为(3+O(ln(ln(k)/α))。该算法的时间复杂度为O([kαln(k)]2(n+m)),其中n和m分别代表设施集合以及客户点集的大小。最后,通过计算机实验验证了k-median问题的反向贪心算法的实际计算效果。 相似文献
17.
18.
针对基于内存的协同过滤算法在线计算量较大,数据稀疏且可扩展性较低的缺点,本文提出了一种基于SVD矩阵填充技术的K-means聚类协同过滤算法。本算法首先利用SVD降维方法对原始的高维稀疏矩阵进行预测填充,得到一个没有缺失值的评分矩阵,而后利用K-means聚类在填充完整的数据上对用户进行聚类,从而对完成对测试集上未知评分进行预测。该算法利用用户与项目之间的潜在关系克服了稀疏性问题,同时保留了聚类方法可离线建模、可扩展性好等优点。实验结果表明,该算法获得了更好的预测性能,同时具有良好的可扩展性。 相似文献
19.
拷贝数变异是一种主要的基因组结构变异形式,会导致基因组区域中出现大小不等的扩增或缺失。针对现有拷贝数变异检测算法受GC含量偏差、测序误差等因素影响而导致检测能力低的问题,提出了一种基于遗传算法优化的BP神经网络拷贝数变异检测算法。该算法充分考虑基因组相邻位置之间的内在相关性,融合多个特征,并使用BP神经网络解决各个特征之间的联合作用以预测CNV;针对现有的BP神经网络模型存在的问题,利用遗传算法优化BP神经网络的权值和阈值,以提高该算法的CNV检测性能。实验结果表明,该算法对不同测序覆盖深度和肿瘤纯度共300个样本的平均检测灵敏度、平均检测精度和平均[F1]评分分别为97.27%、97.78%和97.53%,均优于其他几种算法,且能够显著降低样本边界偏差值。 相似文献
20.
已有的Johnson算法是求解组合问题的一种随机近似算法,可以用于求解MAX-CNF问题。基于该算法,提出新的随机近似算法RCNF求解MAX-CNF问题。概率推导和实验数值均表明,RCNF具有良好的近似比和稳定的性能。在构成难可满足问题的CNF实例上,将新算法与演化算法结合,进一步提出扩展算法E-RCNF。扩展算法利用演化算法的并行性,可以在较短时间内,简单有效地求出最多可满足子句数的近似值。 相似文献