首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 187 毫秒
1.
针对板料成形过程仿真中计算效率低以及四边形单元几何逼近性差的问题,提出一种基于边光滑三角形壳元(Edge-based smoothed triangular shell element,EST)和图形处理器(Graphics processing unit,GPU)的板料成形并行计算方法。根据EST壳元及板料成形过程显式求解的特点,该方法采用将最小计算单位与线程一一对应的方式进行数组的求解,同时,采用并行缩减的方法进行单值的求解,实现了整个计算过程的细粒度并行。考虑到GPU并行计算系统的特点,采用由CPU进行主控,由GPU进行数值求解的程序架构,并以统一计算架构(Compute unified device architecture,CUDA)作为GPU编程环境,编制相应的程序。通过算例表明,与传统CPU串行计算方法相比,在计算精度一致的情况下,当计算模型单元数超过20 000个时,基于GPU的并行计算方法可以获得35倍以上的计算加速比,显著减少板料成形仿真的计算时间。  相似文献   

2.
为提高轴承状态监测的准确性和实时性,研究了基于卷积神经网络和GPU运算的轴承状态识别模型。利用振动信号监测轴承性能状态,应用连续小波变换算法对振动信号进行时频变换得到小波系数云图,通过基于卷积神经网络的深度学习方法进行数据驱动的特征学习,卷积和子采样计算提取具有旋转和尺寸不变性的特征向量,最后全连接层对特征向量进行状态识别。采用基于CUDA(Computer Unified Device Architecture)框架的CPU+GPU异构并行运算对计算模型加速,提高系统的实时性。为验证提出算法的有效性,采集轴承全寿命周期振动信号,运用提出的CPU+GPU计算方法和CPU计算方法分别对轴承运行状态进行识别实验。实验结果表明,所提出的方法,计算速度是CPU计算速度的5倍以上。  相似文献   

3.
篦冷机内水泥熟料温度的软测量   总被引:1,自引:0,他引:1  
篦冷机内高温水泥熟料温度难以在线测量,给篦冷机的控制与热回收优化带来困难。针对这一问题,提出一种基于多孔介质渗流换热理论的篦冷机内熟料层温度软测量模型,并针对此模型设计一种解析法和隐式差分法相结合的流热耦合求解算法。根据所提出的算法对软测量模型进行渗流-传热双向耦合求解,得到了篦冷机内高温水泥熟料由进料口至出料口的温度变化预测值。利用自主设计的试验平台进行高温熟料堆积体冷却试验,试验结果表明,仿真数据与试验数据的误差较小,所建模型对于篦冷机内水泥熟料温度具有较好的测量精度。  相似文献   

4.
基于改进核模糊聚类算法的软测量建模研究   总被引:11,自引:3,他引:8  
针对发酵过程软测量建模采用单模型建模方法存在计算量大和精度较差的问题,提出一种基于改进核模糊聚类算法的多模型神经网络软测量建模方法.该方法首先使用主元分析方法对样本数据进行数据处理,所得主元变量作为模型的输入变量,然后使用基于粒子群优化算法的核模糊C均值聚类算法(PSKFCM)对数据集作聚类划分,最后针对每个聚类建立局部神经网络模型,多个局部神经网络模型估计结果的融合即为软测量模型的输出.将所提建模方法应用于红霉素发酵过程生物量浓度软测量建模,结果表明所建软测量模型具有较高的精度和良好的泛化能力.  相似文献   

5.
基于GPU的混合精度平方根共轭梯度算法   总被引:1,自引:0,他引:1  
针对当前基于GPU的数值算法具有双精度数据性能低下的缺陷.提出了一种适于GPU统一计算架构Fermi-CUDA的混合精度平方根共轭梯度算法用以求解稀疏线性方程组.该算法采用单精度内迭代与双精度外迭代结合的方法,以充分利用GPU体系结构下单精度高性能和双精度高精度的优点.整个算法的计算部分完全在GPU端进行,减少了CPU和GPU之间的数据通信.实现了基于GPU的平方根共轭梯度法、Jacobi迭代法和Gauss-Seidel迭代法,分析它们作为内迭代算子对算法收敛性的影响.实验表明,该算法获得了与全双精度数据处理等同的计算精度,比GPU全双精度在浮点性能上提升近一倍,相对于CPU全双精度串行算法,最大加速比达到70以上.  相似文献   

6.
基于无网格法的连续体结构拓扑优化,具有计算精度高、可消除传统拓扑优化中的数值不稳定性等优势,然而无网格法结构拓扑优化模型的求解存在计算耗时长的问题。为此引入GPU(Graphic processing unit,GPU)并行加速技术,开展无网格法结构拓扑优化模型的GPU并行加速求解及应用研究,以缩短拓扑优化模型的求解耗时。基于交叉节点对思想构建了拓扑迭代中刚度矩阵的GPU并行组装流程,结合CUDA(Compute unified device architecture,CUDA)库函数与预处理共轭梯度法实现了离散方程的GPU并行加速计算,且通过提前计算并存储形函数及其导数值以避免重复计算,建立了无网格法拓扑优化模型的GPU并行加速求解算法。通过二维悬臂梁算例验证了算法的正确性,完成了二维曲形支架、三维支撑平台以及多工况固支梁的拓扑优化设计,并分析了GPU并行算法的加速性能。算例结果表明所提GPU并行加速算法的计算结果正确,且极大地提高了无网格法拓扑优化模型的求解效率。  相似文献   

7.
提出一种基于最小二乘支持向量机(LS-SVM)的高速切削温度预测方法。为验证其可行性,首先,构建了基于LS-SVM的高速切削温度预测模型并选取影响切削温度变化的主要加工参数(切削速度、进给量、轴向切深和径向切宽)为模型输入;其次,采用Box-Beknhen实验设计方法在尽可能多地获取的切削温度变化数据的同时减少实验次数。然后,构建了基于MCV850加工中心的高速切削温度测量系统,验证了所建立模型的预测精度。结果表明:模型预测误差1%;以随机设定的两组不同于实验方案中的切削参数组合为测试数据,预测值偏离测量值百分比分别为0.83%和0.51%,表明所建立预测模型应用于主要加工参数情况下高速切削温度预测的可行性。  相似文献   

8.
业务过程模型的并行度是其质量的重要指标,并行度高的业务过程模型质量更好,运行效率更高。针对提高语义工作流质量的需求,以及现有业务过程模型并行化方法不能处理语义工作流中数据生成—消耗依赖、资源约束等问题,提出一种基于数据生成—消耗依赖的语义工作流并行化重构方法。首先,使用节点编号法和最近公共前驱法获取语义工作流的任务执行关系矩阵;然后,分析了任务节点间的数据生成—消耗依赖,获得数据依赖矩阵;接着,提出任务执行关系更新规则,结合数据依赖矩阵更新任务执行关系矩阵,得到基于数据依赖的任务执行关系矩阵;进一步,设计了兼顾资源约束的语义工作流重构算法以生成并行化后语义工作流;最后,提出一种语义工作流的并行度计算方法以评估并行化后语义工作流的并行程度,并开发了一个交互式的语义工作流并行化重构软件。仿真实验结果表明,所提算法提高了语义工作流的并行度,改善了语义工作流的质量,为提高基于语义工作流的业务过程运行效率提供了有效支持。  相似文献   

9.
出水总氮(TN)和总磷(TP)是衡量水质的重要指标,用人工方法分析存在很大的滞后性且难以测量。针对污水处理过程中强非线性、随机干扰等因素带来的一系列问题,运用基于关联向量机(RVM)的软测量方法,通过数据训练建立起水质软测量模型。试验结果表明,基于关联向量机的污水处理软测量模型能起到较好的预测效果,适合工业应用。  相似文献   

10.
基于RBFNN建模的动态流量软测量方法研究   总被引:2,自引:1,他引:1  
本文通过对粘性流体在圆管中的层流和湍流流量方程对比研究发现,动态流量主要与管道中摩擦导致的压头损失、管道中最大的流速、流体温度变化有关,依据这一原理设计了基于径向基函数人工神经网络(RBFNN)的软测量模型.在伺服阀动态性能实验台上构建了数据采集系统,在新型动态流量测量管上安装超声波、压差、温度传感器来采集各种信息,其中流速信息采用一种新颖的超声波类时差法获取,用于标定的实际流量由无载液压缸的速度传感器获取.基于NeuroSolution软件中的RBF网络模块组成软测量RBFNN,选用部分采集数据作为学习样本对RBFNN进行训练,建立了动态流量的软测量模型.利用采集的数据的测试样本对RBFNN进行测试,通过流量预测曲线和实际曲线的对比,验证了该软测量模型具有很高的逼近精度.该软测量方法为动态流量的测量提供了一条新的途径.  相似文献   

11.
全吉成  王平  王宏伟 《光学精密工程》2016,24(11):2863-2871
提出了计算机图形处理器(GPU)加速的光学航空影像正射校正并行算法,以满足获取光学航空影像对实时性的要求并提高对海量影像数据在CPU上串行正射校正的效率。介绍了光学影像正射校正算法原理以及正射校正算法的并行化处理。为减少GPU执行的计算负载,引入"有效像素区域"概念,设计了改进的GPU并行校正算法。通过配置选择以及存储器访问优化进一步提高了算法的执行效率。最后,分析了GPU并行算法的精度,并验证了噪声干扰对算法的影响。实验结果表明,优化的改进GPU并行算法显著提高了正射校正的速度,影像大小为5 000×5 000时,加速比最高可达CPU串行算法的223倍以上。虽然GPU单精度计算和噪声干扰会使影像校正精度有所下降,但尚在误差允许范围之内。该算法能够快速实现光学航空影像的正射校正,校正后的影像满足实际应用需要。  相似文献   

12.
棉花中的异性纤维给棉纺织企业带来了不小的损失,因此开发出高效率的异纤分拣机是很多纺织企业的迫切需求。现有的异纤分拣机虽然能够达到剔除部分异纤的效果,但由于图像处理运算都是在工控机上的CPU里实现,为了达到在线实时检测的需求,只能采用比较简单的识别算法,异纤识别效果不是很理想。本文通过研究基于CPU+GPU异构系统的棉花异纤识别系统,让GPU通过并行运算来实现异纤的识别算法,从而大大提高了运算效率,有效的减少了算法的运行时间,为复杂的异纤识别算法在异纤识别系统的使用提供了条件,从而有效提高异纤杂质的剔除率。实验表明,基于CPU+GPU异构系统对算法的时间提高了十几倍。  相似文献   

13.
增材制造模型的几何复杂程度和体积不断提高,模型切片所需时间大幅增加,极大影响了数据处理效率。提出了一种自适应负载均衡的异构并行切片算法,利用不断增长的GPU超强并行计算能力对传统切片算法进行了GPU并行化研究,利用模拟退火算法对切片任务进行负载均衡装箱,使各线程间的任务量一致。实验结果证明,该算法提高了模型的切片效率,尤其适合大型或超大型三维模型的快速切片任务。  相似文献   

14.
一种基于图形处理器的频繁模式挖掘算法   总被引:1,自引:1,他引:0  
频繁模式挖掘是数据挖掘的核心问题.传统上,频繁模式并行挖掘主要是在集群上进行的,较少涉及共享内存多处理系统上的并行挖掘.基于广度优先搜索和直接计数策略研究了一种并行挖掘方法,并在图形处理器(graphics processing unit, GPU)最新统一计算设备架构CUDA(compute unified device architecture)下进行了实现.GPU-based FPMA用CPU控制搜索进程;在GPU的多处理器上,采用数据划分的计算策略,以适合GPU的顺序数据流方式计数,并根据候选项的长度动态剪枝事务数据集.实验结果表明,GPU-based FPMA比CPU版本平均加速了10倍以上.  相似文献   

15.
An algorithm is proposed for processing phase images with the use of computing power of graphics processing units (GPUs) for 3D geometry measurements by means of phase triangulation. It is shown that implementation of the phase image decryption algorithm on the GPU is faster by more than 100 times than on the central processing unit (CPU). Practical implementation of the proposed approach can substantially improve the performance of phase triangulation methods.  相似文献   

16.
针对传统连铸结晶器效率低、拉坯速度慢、铸坯表面及形状缺陷等问题,设计并加工了一种高效、高速、高质(Efficient,speedy and quality,ESQ)连铸结晶器内腔形线。基于矩形坯结晶器内传热和结晶收缩行为特性,推导并建立了结晶器铜管内腔形线几何模型,运算得到形线曲线表达式和锥度表达式。根据连铸坯热交换收缩组成模型,针对高碳钢材料大矩形坯规格修正原模型及表达式,将优化结果与钢厂传统形线对比分析。依托Matlab/GUI二次开发了结晶器形线尺寸输出系统,为现有钢厂设计并加工了230 mm×170 mm断面U71Mn钢种结晶器芯棒和铜管,保持其他连铸条件基本不变,使现有连铸机拉坯速度从1.1 m/min提高至1.6~1.7 m/min。结果表明,得到的连铸坯产品表面质量与原产品相近,且并无形状缺陷,验证了模型计算的合理性和正确性。相比于传统连铸结晶器内腔形线,新形线曲线提高了结晶器的换热效率,且保证了铸坯质量,这为增加连铸坯产量提供了基础。  相似文献   

17.
针对在小样本数据情况下训练的连铸漏钢预报模型难以获得较高预报准确率的问题,提出了一种基于主动学习遗传算法-支持向量机(GASVM)分类器的漏钢预报算法。该算法首先将采集到的连铸结晶器坯壳温度数据进行预处理,并将有效数据进行标注;然后利用标注后的小样本数据和遗传算法来优化SVM的经验参数,训练并得到支持向量机模型;最后利用某钢厂采集到的连铸结晶器坯壳温度数据进行测试。测试结果表明,在利用小样本数据进行训练的情况下,所提出的基于主动学习GASVM分类器的连铸漏钢预报算法具有较高的漏钢预报率(预报精度)和100%的漏钢报出率,验证了所提漏钢预报算法的有效性。  相似文献   

18.
运动模糊视频图像在图形处理器平台上的实时恢复   总被引:1,自引:0,他引:1  
王晶  李仕 《光学精密工程》2010,18(10):2262-2268
提出了一种图形处理器优化编程方法,用于实现运动模糊视频图像的实时恢复处理。根据计算统一设备架构(CUDA)的硬件框架特征对GPU的线程块及线程数量进行优化配置,并引入了一种自动内存接合访问的方法,使得GPU的硬件资源得到充分利用。根据图像频谱的对称性去除冗余信息,减少了图像算法在频谱滤波时的数据量,使得GPU对内存的访问次数下降,从而提升了算法效率。实验表明,本文提出的GPU方案的计算性能比传统的CPU平台方案提升了一个数量级,半频谱滤波设计使总时间开销减少20%以上,实验结果证明了本文方案的可行性及有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号