排序方式: 共有15条查询结果,搜索用时 296 毫秒
1.
针对H.266/VVC视频编码标准下的上下文自适应二进制算术编码器编码速度慢、资源开销大的问题,面向可重构结构依据算法的内在并行特性优化了编码架构,并基于动态可重构阵列处理器设计实现了CABAC编码器常规编码模式下的并行映射方法,阵列结构能够根据编码输入对优化后的算法进行动态重构,在避免专用硬件编码器较高的资源开销情况下利用软件重构的方法实现熵编码过程,保证编码准确性的同时提高了视频数据流编码效率,为此类运算密集型算法的硬件实现提供了更为灵活高效的参考途径。仿真结果表明,映射实现的编码过程中每个编码周期完成5个二进制序列的编码,平均编码效率达到384.13Mbin/s。基于FPGA的测试结果表明,软件重构方法与专用硬件实现的编码器相比,资源开销降低且编码效率提升5.47%,与同类型可重构视频编码结构相比,编码效率提升7.03%。 相似文献
2.
推测多线程(speculative multithreading,简称SpMT)技术是一种实现非规则程序自动并行化的有效途径.然而,基于控制流图和分支预测技术的线程划分方法,不可避免地会受到划分路径上所存在的控制依赖和数据依赖的制约.目前,在传统的线程划分算法中存在的一个重要问题是,在对划分路径进行选取时只考虑了控制依赖影响却不能有效地综合考虑数据依赖的影响,进而导致不能选取最佳的划分路径.因此,针对传统方法中这种依赖评估方法效率低下的问题,设计并实现了一种基于路径优化的线程划分算法.该算法通过引入基于程序切片技术的预计算方法,建立一种路径评估方法来评估程序间的控制和数据依赖.同时,引入控制线程体大小的启发式规则,以便有效地解决负载不平衡的问题.基于Olden测试集的测试结果表明,所提出的算法可以有效地对非规则程序进行划分,其平均加速比可以达到1.83. 相似文献
3.
在对程序进行并行化时,为了保证结果的正确性,并行编译器只能采取一种保守的策略,也就是,如果它不能确定两段代码在并行执行时是否会发生冲突,它就不允许这两段代码并行执行.虽然这种做法保证了正确性,但同时也限制了对并行性的开发.在这种背景下,许多推测多线程方法被提了出来,这些方法通过允许可能冲突的代码段并行执行来把握更多的并行机会,同时,通过从冲突中恢复来保证结果的正确性.然而,传统推测多线程方法所使用的“沿控制流将串行程序划分为多个线程”的做法并不适合不同数据结构上的操作在控制流中相互交错的情况,因为如果沿控制流将程序线性地划分为多个线程,则同一个数据结构上的操作将被分到不同的线程中,从而非常容易发生冲突.为了有效地对这些程序进行并行化,提出了一种基于数据结构的线程划分方法与执行模型.在这种方法中,程序中的对象被划分成多个组,同一组中对象上的操作被分派到同一个线程中去执行,从而降低了在同一个数据结构上发生冲突的可能性. 相似文献
4.
5.
针对传统农产品价格预测模型在大数据场景下无法快速准确对苹果市场价格进行预测的问题,提出一种基于分布式神经网络的苹果价格预测方法。首先,研究影响苹果市场价格的相关因素,选取苹果历史价格、替代品历史价格、居民消费水平和原油价格四个特征作为神经网络模型的输入;然后,构建蕴含价格波动规律的分布式神经网络模型,实现对苹果市场价格的短期预测。实验结果显示,基于分布式神经网络的苹果市场价格短期预测模型具有较高的预测精度,平均相对误差仅为0.50%,满足苹果市场价格预测的要求。实验结果表明,分布式神经网络模型能够通过自学习特性揭示出苹果市场价格的波动规律和发展趋势,所提方法能为稳定苹果市场秩序和市场价格宏观调控提供科学依据,有助于降低价格波动带来的危害,帮助果农规避市场风险。 相似文献
6.
如何才能创造出一个成功的设计方案,赢得客户的满意,最终使设计方案在当前激烈的市场竞争中脱颖而出,这是每个从事装饰设计工作的人员必须面临的问题,笔者近几年从事室内装饰设计,总结了一些经验供读者参考。 相似文献
7.
针对三维高效视频编码(3D-HEVC)中,基于深度图的合成视点失真变化(SVDC)算法存在计算时间复杂度较高的问题,提出了一种在可重构阵列结构下基于混合粒度的SVDC算法并行化方法。首先,将SVDC算法分为虚拟视点合成(VVS)和失真值计算两个部分。其次,VVS部分采用流水线作业方式加速,而失真值计算部分采用两级划分加速:任务级——将合成后的图像按照像素点进行划分,指令级——将像素点内部的失真值按照计算过程进行划分。最后,采用可重构机制将VVS部分和失真值计算部分进行并行化处理。理论分析和硬件仿真结果表明,在执行时间上,采用4个处理单元(PE)的该方法具有2.11的加速比性能,与基于底层虚拟机(LLVM)和共享存储并行编程(OpenMP)的SVDC算法相比,计算时间分别缩短了18.56%和21.93%。可见所提方法能挖掘SVDC算法的并行性,并结合可重构阵列结构特点有效缩短了SVDC算法的执行时间。 相似文献
8.
牙龈软组织的形变仿真和建模是虚拟牙齿矫正系统的重要部分.针对外力过大时传统质点弹簧模型引起的牙龈脱落牙齿的"超弹性"问题,在传统"面模型"的基础上,通过对比形变效果和形变速度来设置形变弹簧最优阈值.当形变弹簧缩短或伸长超过阈值时,将弹簧长度恢复为原始长度以作为下一次单步形变的初始长度,从而使面模型具有一种"体"的特征.在形变结束后采用"光滑度之和"来度量牙龈表面的光滑度,该方法从数值上对光滑度进行合理定义.在VTK环境下实现改进模型及相关模型,在真实扫描的牙颌三维模型数据上进行牙龈软组织形变仿真对比实验.结果表明,改进模型形变速度提高28%以上且光滑度之和明显降低,说明改进模型在保证较快形变速度的前提下较好地解决了超弹性问题. 相似文献
9.
针对MEC(memory efficient convolution)卷积算法在传统设备下因访问数据地址不连续导致的缓存命中率低、内存访问延时长等问题,提出一种适用于MEC算法访存行为的优化方法。该方法分为中间矩阵转换和矩阵运算两部分。对于中间矩阵转换部分,采用修改数据读取顺序的方式对其进行优化,使读取方式符合算法的访存行为。对于矩阵运算部分,采用更加适合矩阵运算的内存数据布局对卷积核矩阵修改,并利用TVM(tensor virtual machine)平台封装的计算函数,重新设计中间矩阵同卷积核矩阵的计算方式。使用平台自带并行库对运算过程进行加速。实验结果表明,相比传统MEC算法,提出的优化方法可以有效解决缓存命中率低、内存访问延时长等问题,同MEC算法的运算时间对比,在单个卷积层上平均获得了50%的速度提升,在多层神经网络中最低获得了57%以上的速度提升,同空间组合算法的运算时间对比,最高获得了80%的速度提升。 相似文献
10.
介绍一些在钢结构厂房工程监理中的体会,特别是高强度螺栓预拉力或施工扭矩系数的复检和高强度螺栓连接面抗滑移系数的检验以及高强度螺栓终拧扭矩的确定等工序中应注意的监理控制措施。 相似文献