首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 35 毫秒
1.
合理的配送路线可以提高物流配送的效率。针对标准模拟退火算法串行优化单个解,优化过程较长、效率较低的弱点,提出一种基于多线程模拟退火的并行机制。该机制通过将单个解的串行优化转化为多个串行解同时进行的并行的进行搜索、优化,来提高算法的整体优化效率。利用该算法求解配送路线的选择问题能够显著提高优化效率,计算结果表明该算法是有效的。  相似文献   

2.
为克服交叉相关外推算法时间复杂度高、运算时间过长的缺点,提出一种基于GPU的快速并行化算法,应用于地闪落点的外推预测。首先分析串行的算法流程,然后对算法进行并行化分析设计,再针对AMD系列GPU硬件架构特点,运用OpenCL技术从主存与设备内存之间的数据传输、显存访问模式等方面对算法进一步优化。最后将地闪监测实况数据与本算法外推计算结果进行比对,分析不同精度下串行与并行算法的计算效率。实验结果表明,该算法充分利用GPU强大的并行计算能力,计算速度提高了近17倍。  相似文献   

3.
为了提高伽罗瓦连接所有不动点的计算速度和效率,在计算伽罗瓦连接不动点的串行算法(CbO)基础上,通过处理所有不动点的不相交子集方法,将串行算法并行化,启动P个处理器同时并行运行,使每个处理器都并行地计算它的所有不动点,证明了此算法的正确性,并分析了它的渐近式复杂性。实验给出了算法在各种数据集上的效率及可扩展性,表明PCbO并行算法效率优于其串行算法。  相似文献   

4.
本文提出了基于网格计算的数值SEA效能评估的并行协同算法。该方法首先将SEA串行计算任务合理地划分成若干并行子任务,然后分配到各计算单元上,能充分利用网络中空闲的计算资源,提高计算速度。试验结果表明该方法具有较好的并行加速比。  相似文献   

5.
分析了并行关联规则挖掘算法存在的不足,提出了一种改进的关联规则挖掘的多核并行优化算法。该算法对Apriori算法的压缩矩阵进行了改造,并在多核平台下利用OpenMP技术和TBB技术对串行程序进行循环并行化和任务分配的并行化设计,最大限度地实现并行关联规则挖掘。  相似文献   

6.
头脑风暴优化BSO算法是一种新型的群体智能优化算法,启发于众人集思广益求解问题的模式,适合求解复杂多峰函数优化问题。但是,BSO求解多峰极值时需进行重复的迭代运算,面对大规模数据集时会出现计算效率与求解精度过低的现象。为解决上述问题,设计并实现了一种基于Spark的并行化头脑风暴优化算法,通过将BSO算法中计算复杂度最高的聚类与新解产生过程并行化,以提高算法的加速比与计算效率。特别地,基于并行化思想,将种群划分为多个子群进行协同演化,每个子群独立产生新解来保持种群多样性,提高算法的收敛速度。最后,利用并行化BSO算法求解多峰函数。实验表明,在并行节点的总核心数为10的情况下,并行化BSO算法计算时间节省一半,计算精度和串行BSO算法基本持平,收敛速度明显提高,实验结果说明了并行化BSO的有效性。  相似文献   

7.
并行计算是指同时使用多种计算资源解决计算问题的过程,节省了大量计算时间,极大地提高计算效率.目前各领域大量的串行程序已经相当成熟,所以如何通过一种转换,将现有大量的串行程序转化成并行程序,是提高程序运行速度的突破口.为了将串行程序并行化,以提高程序的运行效率,充分利用已经非常成熟的大量串行程序,文中从图论出发,建立并讨论了串行算法并行化的三个数学模型:有向带权图模型、集合划分模型、标记AVL树模型.通过这些数学模型,基于图论的思想方法,文中讨论了串行算法并行化的可行性,并提出了串行程序并行化的算法思想  相似文献   

8.
降维式自主迁移伪并行遗传算法   总被引:2,自引:0,他引:2  
并行优化算法是一种以优化算法为基础,利用并行计算技术,把问题分解到各个处理器进行处理的算法.以遗传算法为蓝本,提出一种降维式自主迁移的伪并行遗传算法.该算法实现了对高维问题的并行降维优化,并设计出新颖的具有协作性质的信息迁移机制,更好地融合各个处理器的优化信息.测试了3种不同的迁移处理器中优化信息的方法,并对11个具有30维的连续函数进行测试.测试结果与其它并行遗传算法进行了比较,该方法在求解精度和速度上都要比传统的串行遗传算法和并行遗传算法优胜.  相似文献   

9.
魏文红 《计算机应用》2015,35(10):2933-2938
针对约束差分进化算法中单一约束处理技术无法适合所有优化问题的情况,提出了一种混合多种约束处理技术的并行约束差分进化算法。该算法将种群分成多个子种群,各子种群采用不同的约束处理技术并行地独立进化,在适应值评价时进行种群间的通信交流。通过混合4种约束处理技术,使得算法对于所有测试函数都能成功地寻找到最优解,而且运算时间是串行算法的1/4。实验结果表明:与相应的串行算法及采用单一约束处理技术的算法比较,所提算法具有更高的求解精度、更少的计算时间和更快的收敛速度。  相似文献   

10.
为了充分利用多核处理器的硬件资源和计算能力,提出了多核并行编程技术在中文分词程序中的优化方案.根据中文分词最大正向匹配算法的特点,由传统的串行程序,改为并行程序.利用多核并行编程模式的思想,设计了一个混合并行编程模式,通过Intel的性能分析工具,找出了该算法的热点和瓶颈,对其进行优化.实验结果表明,优化过后的执行时间较原来串行程序的执行时间缩短了50%~60%,同时提高了程序的加速性能,取得了良好的效果.  相似文献   

11.
一种模拟退火和粒子群混合优化算法   总被引:3,自引:1,他引:2  
针对粒子群优化算法(PSO)容易陷入局部极值点、进化后期收敛慢和优化精度较差等缺点.把模拟退火技术(SA)引入到PSO箅法中,提出了一种混合优化算法.混合优化算法在各温度下依次进行PSO和SA搜索,是一种两层的串行结构.由于PSO提供了并行搜索结构,所以,混合优化算法使SA转化成并行SA算法.SA的概率突跳性保证了种群的多样性,从而防止PSO算法陷入局部极小.混合优化算法保持了PSO算法简单容易实现的特点,改善了算法的全局优化能力,提高了算法的收敛速度和计算精度.仿真结果表明,混合优化算法的优化性能优于基本PSO算法.  相似文献   

12.
蚁群优化算法应用于复杂问题的求解是非常耗时的。文章在MATLAB环境下实现了一个基于GPU+CPU的并行MAX-MIN蚁群系统,并将其应用于旅行商问题的求解。让全部蚂蚁共享一个伪随机数矩阵,一个信息素矩阵,一个禁忌矩阵和一个概率矩阵,并运用了一个全新的基于这些矩阵的随机选择算法—AIR(All-In-Roulette)。文章还介绍了如何使用这些矩阵来构造并行蚁群优化算法,并与相应串行算法进行了比较。计算结果表明新的并行算法比相应串行算法要高效很多。  相似文献   

13.
在并行优化编译器的并行识别过程中,许多串行代码无法找到全局一致的分解结果,数据重分布无可避免,有必要寻找一种有效的方法求解计算和数据的动态分解。该文研究了单个嵌套循环计算与数据分解算法以及分解结果表示方法,提出一种在多个嵌套循环间求解数据线性一致分布的动态分解算法,结合程序的结构分析和程序的控制流信息,用于通用串行代码的并行分解过程,可以同时给出串行代码的计算划分和数据分布结果。  相似文献   

14.
王晓升 《计算机应用》2010,30(11):2967-2969
为了更好地解决现代多媒体嵌入式系统动态数据结构优化问题,结合NSGA-II和SPEA2两个多目标进化算法,引入岛屿模型和多线程机制,提出了一种并行多目标进化算法--PMOEA-NS。基于多核计算机系统,使用PMOEA-NS具体的3个不同并行算法和串行NSGA-II、SPEA2,对一个实际动态嵌入式应用程序进行优化实验和计算,结果表明:与串行算法NSGA-II和SPEA2相比,并行算法不但提高了优化过程的速度,而且改善了解的质量和多样性。  相似文献   

15.
基于CUDA的并行粒子群优化算法的设计与实现   总被引:1,自引:0,他引:1  
针对处理大量数据和求解大规模复杂问题时粒子群优化(PSO)算法计算时间过长的问题, 进行了在显卡(GPU)上实现细粒度并行粒子群算法的研究。通过对传统PSO算法的分析, 结合目前被广泛使用的基于GPU的并行计算技术, 设计实现了一种并行PSO方法。本方法的执行基于统一计算架构(CUDA), 使用大量的GPU线程并行处理各个粒子的搜索过程来加速整个粒子群的收敛速度。程序充分使用CUDA自带的各种数学计算库, 从而保证了程序的稳定性和易写性。通过对多个基准优化测试函数的求解证明, 相对于基于CPU的串行计算方法, 在求解收敛性一致的前提下, 基于CUDA架构的并行PSO求解方法可以取得高达90倍的计算加速比。  相似文献   

16.
决策树分类方法是解决数据挖掘、模式识别中分类任务的有效方法,然而,在大规模的数据集上运行时,其运行效率受到严重影响。文中选取决策树的代表算法C4.5算法为研究对象,利用算法固有的并行性对其进行优化研究。文中利用MATLAB实现串行的C4.5决策树,并对构成该决策树的子函数进行运行时间分析,从而确定信息增益率计算的复杂性为限制算法速度的关键因素。针对此计算瓶颈,结合决策树算法在子节点分割以及最优分裂属性选择等方面的并行性,纵向划分数据,构建了并行的C4.5决策树,并利用MATLAB并行计算池功能以及SPMD设计实现。对并行后决策树运行时间验证结果表明,将C4.5决策树并行化后,并行决策树的构建时间显著缩短,实现了算法的加速。  相似文献   

17.
传统求图传递闭包的方法存在计算量大与计算时间长的问题。为加快处理大数据量的传递闭包算法的计算速度,结合算法密集计算和开放式计算语言(OpenCL)框架的特征,采用本地存储器优化的并行子矩阵乘和分块的矩阵乘并行计算,提出一种基于OpenCL的传递闭包并行算法。利用本地存储器优化的并行子矩阵乘算法来优化计算步骤,提高图形处理器(GPU)的存储器利用率,降低数据获取延迟。通过分块矩阵乘并行计算算法实现大数据量的矩阵乘,提高GPU计算核心的利用率。数据结果表明,与CPU串行算法、基于开放多处理的并行算法和基于统一设备计算架构的并行算法相比,传递闭包并行算法在OpenCL架构下NVIDIA GeForce GTX 1070计算平台上分别获得了593.14倍、208.62倍和1.05倍的加速比。  相似文献   

18.
基于消息传递接口(Message Passing Interface,MPI)和消息传递并行编程模型,提出了一种针对计算机集群(Cluster)的纹理图像并行分割算法。该算法使用马尔可夫随机场作为纹理特征,通过将图像分块,把特征提取的计算量均匀的分布到并行系统中的各个节点上,从而极大地减少了计算时间。在遥感图像上的实验发现,该算法在4机并行的环境下可以取得与单机串行程序一样精确的分割,而耗时仅为串行程序的31.95%。令人满意的实验结果表明该并行算法不但可以有效的应用于纹理图像分割,而且也为使用计算机集群实现高时间复杂度的图像处理提供了有益的启示。  相似文献   

19.
王鑫  张铭 《计算机应用研究》2023,40(6):1745-1749
针对应用普通卷积结构的卷积计算复杂度较高、计算量与参数量较大的问题,提出以国产SW26010P众核处理器为平台的并行分组卷积算法。核心思想是利用独特的数据布局,通过多核映射处理进行并行计算。实验测试结果表明,与单核串行算法相比,使用该并行分组卷积算法可以获得79.5的最高加速比及186.7MFLOPS的最大有效算力。通过SIMD指令对并行分组卷积算法进行数据并行优化后,与使用优化前的并行分组卷积算法相比,可以获得10.2的最高加速比。  相似文献   

20.
并行计算的发展大大提高计算机的计算效率,降低计算时间.针对多体动力学的优化问题,分析了求解灵敏度的三种方法的并行性,建立了有限差分法与直接微分法的并行算法.同时采用并行Armijo线性搜索,构成了完整的并行序列二次规划(SQP)算法.将上述算法应用到曲柄滑块的优化中,并与串行SQP算法进行了比较,证实了并行SQP算法可以大大降低计算时间.上述研究为多体动力学优化提供了一种并行求解思路.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号