首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
多媒体应用程序的一个最突出的特点就是其内在的并行性,要求同时对多个数据单元进行相同的规则操作,这种并行性被称为子字并行。如何让编译器产生有效的并行代码,如何从普通的串行C程序中识别出子字并行指令,是一个前沿性的研究课题。提出了一种用于实现对串行源代码进行显式表示的方法,该方法对数字信号处理领域常用的同步数据流图方法进行改进,结合模式匹配技术,着眼于内层循环,通过扩展规范的模式库,对带模式识别的数据流、控制流进行分析,能够从串行应用程序中自动地提取其固有的子字并行,得到显式的并行化中间表示,基于这种数据流图表示,采用改进的树模式匹配实现子字并行指令选择和代码生成。实验测试表明了该方法的有效性。  相似文献   

2.
异步电路能很好地解决同步集成电路设计中出现的时钟扭曲和时钟功耗过大等问题。本文采用异步集成电路设计方法设计了一款32位异步子字并行乘累加单元,并在0.18μm工艺条件下实现了该单元。通过使用特殊的部分积译码电路,该乘累加单元能支持多种子字并行模式,适用于多媒体处理。评测结果表明,异步乘累加单元的性能和功耗指标均优于采用同样结构的同步乘累加单元。  相似文献   

3.
论文致力于对图像处理算法的串行C程序进行子字并行分析,并重定向到带有多媒体扩展的通用处理器和多媒体专用嵌入式微处理器。图像处理算法的特点决定其是内在可并行的,这种并行粒度介于数据并行(DLP)和指令级并行(ILP)之间,称之为子字并行。但是,当前的编译技术很难充分挖掘和定位程序基本块内的子字并行,对此设计了一种基于流图程序表示的编译方法,能够从串行程序中显式地定位子字并行。扩展了编译器的功能,增加了特定的模式库,基于模式识别的控制流和数据流分析后,产生特定的子字并行流图(SWFG,Sub-WordFlowGraph),并将该图作为中间表示,提供给子字并行指令选择,进而实现有效的子字并行代码产生。  相似文献   

4.
介绍了一种64位子字并行整数乘法器,用相同的硬件可实现64bit×64bit的整数乘法操作操作,又可实现4个16bit×16bit的子字并行整数乘法操作.此乘法器采用了一种简单有效的修正算法,并在部分积累加之前合并了修正值.采用这种算法实现的子字并行乘法器总体结构与传统的乘法器结构不同.经过spice模拟,此乘法器达到了较优的延迟.  相似文献   

5.
子字并行能够充分利用多媒体算法的数据精度小、内部循环处理形式规则的特点,是加速多媒体处理的有效方式。然而,如何充分挖掘多媒体应用中的子字并行仍然是一个难题。本文说明传统的并行技术可以有效地开发循环中的子字并行性,同时提出一种基于代价子图的子字并行指令自动识别的方法。与其他方法相比,该方法利用代价模型对子子字并行指令选择进行定量评估。本文在TTA体系结构框架下实现了这一方法。实验结果表明,该方法可以充分地提取循环中的子字并行性。  相似文献   

6.
提出了一种支持子字并行的乘法器体系结构,并完成了其VLSI设计与实现。该乘法器在16 bit阵列子字并行结构的基础上,扩展了有符号与无符号之间的混合操作,采用多周期合并技术,实现了32 bit宽度的子字并行,并支持子字模式的乘累加,同时采用流水线设计技术,能够在单周期内完成4个8×8、2个16×16或1个32×16的有符号/无符号乘法操作。0.18 μm的标准单元库的实现表明该乘法器既能减小面积又能提高主频,是硬件消耗和运算性能的较好折衷,非常适用于多媒体微处理器的设计。  相似文献   

7.
飞机设计是一个多学科的复杂的系统工程,各个学科通常相互影响、相互耦合.这使得飞机设计过程日趋复杂,设计周期越来越长,开发成本越来越高,而并行子空间优化(CSSO)是解决这些问题的一种有效方法.文中对基于神经网络响应面的并行子空间优化算法及其在无人机总体方案设计优化中的应用进行了研究.并行子空间优化算法将多学科耦合的无人机设计优化问题分解为不同的子空间问题,在不同的子空间中建立各自的神经网络响应面,通过响应面完成各子空间之间的数据交换与协调,以此来逼近设计空间最优解.应用结果表明,CSSO算法能有效地应用于无人机总体方案优化设计.  相似文献   

8.
一种并行查询优化策略   总被引:2,自引:0,他引:2  
叙述了在扩展BSP计算机上实现的shared_nothing并行对象关系数据库(PORDB)的两阶段查询优化。它分为顺序优化阶段和并行化两个阶段。顺序优化阶段在预测并行通信代价的基础上,采用基于代价的顺序查询优化。并行化阶段为缩减探索空间,先按照并行模式划分并行单元,再以并行单元为单位分配处理机。BSP模型可简化并行模式的实现和并行单元的划分。  相似文献   

9.
子字并行加法器能够有效提高多媒体应用程序的处理性能。基于门延迟模型对加法器原理及性能进行了分析,设计了进位截断和进位消除两种子字并行控制机制。在这两种机制的指导下,实现了多种子字并行加法器,并对它们的性能进行了比较和分析。结果表明进位消除机制相对于进位截断机制需要较短的延时,较少的逻辑门数以及较低的功耗。在各种子字并行加法器中,Kogge-Stone加法器具有最少的延迟时间,RCA加法器具有最少的逻辑门数和最低的功耗。研究结果可以用于指导子字并行加法器的设计与选择。  相似文献   

10.
并行Turbo译码提高了数据吞吐量,但同时也降低了译码性能.为此,分析并行Turbo译码中的无冲突交织条件,介绍一种行列随机交织器并对其改进,将S-距离规则用于其交织过程,使每列(行)相同位置产生的随机数之间的距离绝对值大于等于S.仿真结果表明,与行列随机交织器相比,改进方案在交织后能提高数据的分散度,增大每个子译码器...  相似文献   

11.
董冕  吴丹  饶金理  黄威  戴葵  邹雪城 《计算机工程》2012,38(16):249-252
通过硬件共享的方式实现一套高性能子字并行运算单元,运算单元采用流水线设计,可以一个周期进行1个64-bit、2个32-bit、4个16-bit或8个8-bit定点运算,1个双精度或2个单精度浮点运算。运算单元采用Verilog HDL设计,在0.18 μm 标准CMOS工艺库下实现,并针对实际多媒体应用程序基于ESCA系统进行性能评测。实验结果表明,该运算单元可以在硬件开销和性能上获得较好的平衡。  相似文献   

12.
The level of quality that can be achieved by modern concatenative text-to-speech synthesis heavily depends on a judicious composition of the unit inventory used in the unit selection process. Unit boundary optimization, in particular, can make a huge difference in the users' perception of the concatenated acoustic waveform. This paper considers the iterative refinement of unit boundaries based on a data-driven feature extraction framework separately optimized for each boundary region. This guarantees a globally optimal cut point between any two matching units in the underlying inventory. The associated boundary training procedure is objectively characterized, first in terms of convergence behavior, and then by comparing the distributions in inter-unit discontinuity obtained before and after training. Experimental results underscore the viability of this approach for unit boundary optimization. Listening evidence also qualitatively exemplifies a noticeable reduction in the perception of discontinuity between concatenated acoustic units  相似文献   

13.
Essentially, it is significant to supply the consumer with reliable and sufficient power. Since, power quality is mea sured by the consistency in frequency and power flow between control areas. Thus, in a power system operation and control, automatic generation control (AGC) plays a crucial role. In this paper, multi-area (Five areas: area 1, area 2, area 3, area 4 and area 5) reheat thermal power systems are considered with proportional-integral-derivative (PID) controller as a supplemen tary controller. Each area in the investigated power system is equipped with appropriate governor unit, turbine with reheater unit, generator and speed regulator unit. The PID controller parameters are optimized by considering nature bio-inspired firefly algorithm (FFA). The experimental results demonstrated the comparison of the proposed system performance (FFA-PID) with optimized PID controller based genetic algorithm (GA PID) and particle swarm optimization (PSO) technique (PSO PID) for the same investigated power system. The results proved the efficiency of employing the integral time absolute error (ITAE) cost function with one percent step load perturbation (1% SLP) in area 1. The proposed system based FFA achieved the least settling time compared to using the GA or the PSO algorithms, while, it attained good results with respect to the peak overshoot/undershoot. In addition, the FFA performance is improved with the increased number of iterations which outperformed the other optimization algorithms based controller.   相似文献   

14.
分析了锦界直接空冷机组经济指标差的原因,重点阐述了锦界直接空冷机组进行运行系统优化过程、运行系统优化后节能降耗的效果以及以后需要解决的问题。用数据说明了运行系统优化对直接空冷机组节能降耗的贡献,作为实例,以供同类机组借鉴。  相似文献   

15.
周永华  刘阳 《控制工程》2012,19(4):603-606
串联校正是控制系统校正中常用的几种校正方式之一.在进行串联校正时,经常使用超前校正装置和滞后校正装置这两种校正装置.然而,在应用这两种校正装置对控制系统进行串联校正时存在很多的缺点和不足,如只能对有限的控制系统进行校正、在进行校正时这两种装置的参数的求解过程过于复杂等.为了克服这些缺点和不足,提高控制系统校正的效率,首先将超前校正装置和滞后校正装置进行串联构成多级校正装置,然后采用遗传算法程序直接对多级校正装置的参数进行寻优,找出满足性能指标要求的多级校正装置的参数,从而实现控制系统的校正.仿真结果表明,这种方法不但简化了控制系统校正的过程,而且扩展了可校正系统的范围,对控制系统设计的研究具有一定的参考价值.  相似文献   

16.
彭元喜  邹佳骏 《计算机应用》2010,30(7):1978-1982
X型DSP是我们自主研发的一款低功耗高性能DSP。对X型DSP的CPU体系结构进行了深入研究,在详细分析X型DSP的ALU部件和移位器部件相关指令基础上,对ALU与移位器部件进行了设计与实现。采用Design Compiler综合工具,基于SMIC公司0.13um CMOS工艺库对ALU移位部件进行了逻辑综合,电路功耗共为4.2821mW,电路面积为71042.9804m2,工作频率达到250MHz。  相似文献   

17.
基于正多面体的球面三角剖分与分析   总被引:2,自引:0,他引:2       下载免费PDF全文
球面离散格网模型单元的面积、形状是否相似关系到模型的精度,因此定量分析单元的几何变形、分布规律等是格网模型建模的重要组成部分。文章通过对基于正八面体和正二十面体球面剖分获得的球面三角单元进行分析,分析结果表明随着剖分层次的增加单元面积和形状变化趋于稳定,基于正二十面体的球面剖分与基于正八面体相比有更好的相似性;单元的变形程度与其到正多面体顶点的距离成负相关,而周长和面积变化成正相关;单元各属性比值所占的百分比与剖分层次无关,其较大峰值都分布在正多面体的顶点附近。  相似文献   

18.
In this study, the consistency of systematic retrievals of surface reflectance and leaf area index was assessed using overlap regions in adjacent Landsat Enhanced Thematic Mapper-Plus (ETM+) scenes. Adjacent scenes were acquired within 7-25 days apart to minimize variations in the land surface reflectance between acquisition dates. Each Landsat ETM+ scene was independently geo-referenced and atmospherically corrected using a variety of standard approaches. Leaf area index (LAI) models were then applied to the surface reflectance data and the difference in LAI between overlapping scenes was evaluated. The results from this analysis show that systematic LAI retrieval from Landsat ETM+ imagery using a baseline atmospheric correction approach that assumes a constant aerosol optical depth equal to 0.06 is consistent to within ±0.61 LAI units. The average absolute difference in LAI retrieval over all 10 image pairs was 26% for a mean LAI of 2.05 and the maximum absolute difference over any one pair was 61% for a mean LAI of 1.13. When no atmospheric correction was performed on the data, the consistency in LAI retrieval was improved by 1%. When a scene-based dense, dark vegetation atmospheric correction algorithm was used, the LAI retrieval differences increased to 28% for a mean LAI of 2.32. This implies that a scene-based atmospheric correction procedure may improve the absolute accuracy of LAI retrieval without having a major impact on retrieval consistency. Such consistency trials provide insight into the current limits concerning surface reflectance and LAI retrieval from fine spatial resolution remote sensing imagery with respect to the variability in clear-sky atmospheric conditions.  相似文献   

19.
为了从结构、功能和行为3个层面对智能机器人体系结构进行一体化描述,本文提出了智能机器人神经心理模型.借鉴脑的3个基本机能联合区理论建立了智能机器人的神经生理结构模型,将机器人思维系统划分为感知区、反射区和慎思区,每个区均由三级皮层构成,采用拓展的BD I逻辑(机器人心智逻辑RML)描述机器人的认知心理机制,给出了神经心理框架下的机器人智能行为过程,从理论上证明了RML的可靠性与完备性,采用水下机器人编队穿越未知雷区的对比仿真实验验证了神经心理模型的可行性和有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号