首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 125 毫秒
1.
基于LSMPP的K元2-立方体网络结构,设计了一种新颖快速的计算FFT的SIMD算法。系统地分析了时间提取的基-2一堆FFT算法及其原理,较详细地讨论了用二雏FFT算法并行计算二堆DFT的问题:主要从算法原理出发,分析并给出了在LSMPP SIMD计算机上用二雏FFT并行计算二堆DFT时各变换步的变换矩阵及其格式,设计了自动建立各变换步的变换矩阵的算法。  相似文献   

2.
K元2—立方体网络SIMD计算机图像模板匹配并行算法   总被引:5,自引:0,他引:5  
李俊山  沈绪榜 《计算机学报》2001,24(11):1196-1201
模板匹配是进行虑波、边缘检测、目标识别和图像匹配的一种基本和有效的方法 .对于 N× N的图像和M× N ( M相似文献   

3.
计论在网络并行处理和高分辨率实时成像处理中起重要作用的快速傅立叶变换,结合近年来人们对该算法并行化的研究成果,剖析一种基于SIMD-MC2模型上的实用并行算法,并对该算法复杂度进行了分析,结果表明该算法的高效性.  相似文献   

4.
二维快速傅立叶变换(FFT)在一个传统概念的处理机上实现时,需要芯片具有更多的逻辑资源。本文给出了基于FPGA的自定义处理机(CCM)的二维FFT算法和实现。在CCM的Splash-2平台上实现了二维FFT,计算速度达到180Mflops,最快速度超过Sparc-10工作站的23倍。同时,对于一个N×N图像,这种实现方法可以满足二维FFT所需要的O(N2log2N)次的浮点算术运算。  相似文献   

5.
本文提出了一种基于SIMD寄存器SM3并行算法的快速SM2-KDF实现方法.首先预计算KDF所需的计数器ct值,再根据消息长度分组执行串行/并行的SM3哈希运算,在SM3消息扩展与迭代压缩部分使用PSHUFB与VPGATHERDD指令并行处理,之后对数据重新装配以使用256位YMM寄存器进行轮函数的运算,最后将输出哈希值与消息异或得到密文.在AMD Ryzen 5 3600 6-Core@3.6GHz和Intel I5-7200U@2.4 GHz两种测试环境下, SM2的KDF算法在消息长度大于1 KB时速度可提升至标准实现的3倍.在应用并行KDF算法后SM2公钥加密算法加密速度最快可提升47%,解密速度最快可提升53%,本方法同样适用于其他杂凑算法和公钥加解密算法的软件加速.  相似文献   

6.
基于二维混合变换(DCT-DWT)的图像水印算法   总被引:1,自引:0,他引:1  
本文首先分析现有的离散余弦变换(DCT)和小波变换(DWT)结合的数字图像水印算法;然后,给出二维混合变换(DCT-DWT)的定义,性质,算法;最后提出基于DWT-DCT混合变换的嵌入和检测水印的算法。试验结果:该算法有很好的鲁棒性。  相似文献   

7.
提出了一种对角离散余弦变换(Discrete Cosine Transform,DCT)和二维主元分析(Two-Dimensional Principal Component Analysis,2DPCA)相结合的人脸识别方法。该算法首先将人脸图像转换成对角图像,同时利用DCT压缩并重建人脸图像;然后通过2DPCA进行特征提取得到人脸识别特征;最后运用最近邻分类器进行识别。基于ORL(Olivetti Research Laboratory)、受污损ORL及Yale人脸数据库的实验结果证明了该算法的有效性。  相似文献   

8.
基于(2D)2NMF及其改进算法的人脸识别   总被引:1,自引:0,他引:1  
高宏娟  潘晨 《计算机应用》2007,27(7):1660-1662
非负矩阵分解(NMF)是基于部分的特征提取方法,能够克服局部遮挡和光照问题,在图像识别任务中效果较好。然而传统算法中,NMF提取的特征是非正交的,且二维图像常被向量化处理,不仅丢失一些结构信息,还导致了数据的高维,不利于提高识别精度和速度。利用图像矩阵取代传统的图像向量表示,提出新的(2D)2NMF方法提取二维图像特征,并通过特征正交化和图像变形等措施,改善了算法性能。人脸识别实验表明,上述措施能够有效提高识别的精度和速度。  相似文献   

9.
提出一种离散余弦变换和改进的分块二维主元分析相结合的人脸识别方法。该算法利用DCT压缩人脸图像以去掉人眼不敏感的中频分量与高频分量,这样有效降低所需特征的维数,减少计算量。通过IM2DPCA进行特征提取得到人脸识别特征,运用最近邻分类器完成人脸的识别。在基于ORL、YaleB、CAS-PEAL及Feret人脸数据库的实验结果证明该算法的有效性与稳健性。  相似文献   

10.
为使融合后的图像在尽可能保留源图像细节信息的同时,还能够有效提高源图像的对比度,提出基于(2D)2-KL((2D)2-Karhunen-Loeve)变换的小波域图像融合算法.首先用(2D) 2-KL变换直接对图像信息进行分析,并构建协方差阵,提取图像的重要特征,然后将其主要特征输入到小波域中.在此基础上,对小波变换分解得到各子带系数,用一定的融合策略进行融合.低频子带含有图像的轮廓信息,引入加权因子指导低频子带系数进行融合.实验结果表明,提出的算法有效提高了图像的对比度,并且很好地保留了图像的细节信息,无论在视觉角度上,还是在各种客观性能评价上都比其它传统方法取得了更佳的融合效果.  相似文献   

11.
SIMD-BF模型上的并行FWHT算法研究   总被引:1,自引:0,他引:1  
蝶形网络是并行计算中的一种重要的网络拓扑结构.并行计算模型是并行算法设计和分析的基础.文章以并行FFT算法的基本思想为基础,根据快速Walsh-Hadamard变换的两种蝶式计算流图,提出SIMD-BF模型上的两种并行FWHT算法.算法分析的结果表明:离散Walsh-Hadamard变换算法的复杂度为O(n2);快速W...  相似文献   

12.
本文针对粒子滤波器计算量大、实时性差的问题分析了高斯粒子滤波的并行结构,并以一个简单实例为背景介绍了高斯粒子滤波器在集群计算机上的应用实现。  相似文献   

13.
随着图像匹配的应用越来越广泛,图像匹配的实时性要求也越来越高。为了提高图像匹配的速度和更好地利用多核计算资源,设计了一种基于Hausdorff距离的图像匹配并行算法。首先介绍了Hausdorff距离的定义,然后分析了图像匹配串行算法的效率,在此基础上设计了基于Hausdorff距离的图像匹配并行算法,最后采用Matlab在多核计算机上对并行算法进行了实现。实验结果表明,文中所设计的并行算法能够显著提高图像匹配速度,并具有较好的抗失真和抗噪声性能。文中设计的并行算法有较好的扩展性,可以将这种并行思想应用到其它图像匹配算法的并行设计中。  相似文献   

14.
The implementation of the Because Benchmark Set programs on the Connection Machine CM-2 is presented and discussed. The characteristics of this machine have been taken into account during the BBS implementations, leading to somewhat different formulations, for some of the BBS programs. These situations are detailed to outline the way algorithms work.

In a second section, the generation of a Computational Fluid Dynamics software is described; the numerical method used (spectral method) is explained, in order to understand the algorithmic solutions that are proposed. The resulting code has then been run on an example showing mixing layer instability, and then compared with similar codes running on Convex and CRAY II vector supercomputers.  相似文献   


15.
基于国产 YH 并行机的并行算法的设计分析 ,实现程序高效并行。采用宏任务的并行方式 ,实现子程序级的并行 ,其并行粒度大 ,总的开销小 ,并行效果好。  相似文献   

16.
Diffie-Hellman算法通过密钥交换的方式为企业VPN网络的信息传输提供数据机密性,其有效性依赖于计算离散对数的难度。在描述算法过程的基础上,利用Visual C++语言编程并在Windows XP环境中编译。通过一个具体的企业VPN网络部署和配置,实现了企业内网对等体之间通过VPN隧道的相互通信和对Internet资源的访问,分析了由于加载VPN数据包而对网络性能产生的影响,主要体现在网络吞吐量和网络延迟的变化上。因此提高VPN网络的应用性能和数据传输的质量是今后研究的主要方向。  相似文献   

17.
提出了一个并行矩阵乘算法IPBPMM(Interconnected Processor-Based Parallel Matrix Multiplication).该算法运行在以五角形、Petersen图和Hoffman-Singleton图等直径为2的摩尔图(满足n=d2+1,n为节点数,d为度)为拓扑结构的由n个独立处理器构成的机群并行计算环境中.与基于二维环绕网孔阵列拓扑结构的Cannon和Fox等并行矩阵乘法算法相比较,IPBPMM算法通信开销较小,加速比更高,同时还具有矩阵分块可随机分布在各个节点中,无需事先按一定规律装入各节点中的特点.同时IPBPMM算法也能很好地扩充到由多个直径为2的摩尔图为拓扑结构组合构成的并行计算环境中,且随着网络的扩大,算法的并行加速比更高.  相似文献   

18.
在组播通信网络中,在满足组播速率的前提下,如何使编码资源开销最小化即网络编码优化是一个NP难问题.针对现有基于基本遗传算法的网络编码优化的不足,提出基于GPU的并行遗传算法应用于网络编码优化.通过在不同的网络拓扑结构中进行仿真实验,结果表明提出的并行遗传算法能够在更短的时间内找到满意的编码方案,具有更高的性能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号