首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
嵌入式多媒体设备要求具有更高的处理能力、极低的功耗,以延长电池供电设备的工作时间。提高CPU的工作频率或者增加CPU内并行的工作单元可提高CPU处理能力,但相同工艺下更高的频率要求更高的工作电压和更大的功耗,并行的工作单元只能利用局部指令的并行性,一些单元得不到充分利用,造成功耗的浪费。使用不同类型的处理器并行工作,充分发挥各个CPU的处理优势,可有效降低多媒体设备的功耗。  相似文献   

2.
徐宁  史册  陈梅丽 《计算机工程》2006,32(23):268-270
由于H.264/AVC新标准采用了很多新技术,在可编程处理器的应用领域中,如果不进行优化将会需要非常大的存储空间。该文对编码器的存储复杂度进行了分析,在此基础上提出了基于宏块级的滤波和插值算法。为了便于嵌入式处理器的实现,提出了一种高效的内存管理调度策略。实验结果表明,优化方法在极大地降低存储复杂度(cycle:64.9%)的同时得到了更高的编码速率(76.6%),而只有很小的编码效率损失。  相似文献   

3.
H.264作为新一代视频编码标准,具有很好的性能,但计算复杂度比较高。Storm处理器是一款面向媒体应用和信号处理的高效能流处理器,在媒体处理方面具有很好的应用前景。针对H.264对计算性能的要求,本文给出了高清H.264(1080P)变换编码在Storm-SP16 G160流处理器上的流式实现。本文根据不同算法的数据流特征,结合具体的流化过程详细介绍了并行粒度选择以及数据流组织、规范化处理等流化技术。实验结果表明:编码的流式实现具有很好的性能,按照此编码效率加速整个程序可满足实时要求。提供了一种不同于硬件加速的程序加速方法,对其他媒体应用在流处理器上的映射具有很大的借鉴意义。  相似文献   

4.
基于同构多核处理器的H.264多粒度并行编码器   总被引:2,自引:0,他引:2  
H.264码率低和视频质量高的优越性能以增加编码计算的复杂度为代价,如何开发适用于多核处理器平台的并行编码算法是提高其编码速度的重要研究内容,对于满足高清视频实时传输和大规模共享具有十分重要的意义.利用H.264开源编码器项目X264,在片级和数据级并行编码算法的基础上,通过分析图像帧之间的参考关系,提出并实现了B帧个数可变的帧级并行算法;根据宏块之间的参考关系,设计了一种类似流水线的宏块级并行方法;基于Intel同构多核平台,提出融合帧级、片级、宏块级和数据级4种不同粒度的并行编码方案,开发了H.264多粒度并行编码器.实验结果表明,在码率增加不大的情况下,H.264多粒度并行编码器可以很好地提升编码加速比,视频编码质量符合高质量的要求.  相似文献   

5.
基于H.264算法的嵌入式视频服务器   总被引:6,自引:0,他引:6  
介绍了基于H.264算法的视频服务器系统的实现,在设计中采用TI公司的多媒体处理芯片DM642作为核心,以H.264优化算法实现视频编解码。重点阐述了嵌入式视频服务器的系统架构,DM642的性能和特点,H.264算法在DM642芯片上的实现和优化。  相似文献   

6.
介绍一种以开源编码器x264为基础,在其上实现H.264的时域可伸缩编码的设计方案和实现.实现时域可伸缩编码的NAL单元切片类型重定义,编码顺序重排,并增加了所需的语法结构,编码器能够实现QVGA格式的实时时域可伸缩编码.  相似文献   

7.
H.264并行编码中负载平衡方法   总被引:1,自引:0,他引:1       下载免费PDF全文
针对在多核处理器上Slice并行编码H.264高清视频中的负载不平衡问题,首先利用已编码帧的编码统计信息,根据帧间时间相关性预测下一帧各宏块的编码负载,然后据此预测的编码负载划分Slice,使各个处理器核上编码的Slice具有相接近的计算负载,从而达到动态负载平衡目的。在Tile64多核平台上的实际测试结果表明,与传统的基于宏块区域的动态数据分配算法相比,该方法可以将编码并行加速比和并行效率提高5%左右。  相似文献   

8.
基于H.323协议的H.264视频传输   总被引:1,自引:0,他引:1       下载免费PDF全文
通过研究H.264标准在Openh323系统中的应用,实现了在IP网络中基于H.323协议的H.264视频传输,给出了H.264在Openh323系统中的传输方案,并与H.261和H.263编码标准的结果进行了比较分析,得到了令人满意的实验结果。  相似文献   

9.
Windows平台下应用FFMPEG实现H.264视频回放   总被引:4,自引:0,他引:4  
H.264是ISO/IEC MPEG和TTU-T VCEG联合制定的最新的视频编码标准,其压缩性能和图像质量大大优于先前的视频编码标准.然而,Windows平台上的Windows Media Player需要第三方插件才支持H.264格式视频的播放,很多插件如ffd-show等只支持AVI容器中的H.264播放,不支持ASF容器中的H.264视频播放.因此本文分析Windows平台的DMO等技术,利用开源程序FFMPEG,实现在Windows平台下与Windows Media Player配合的支持ASF文件容器中H.264视频回放的插件.  相似文献   

10.
MPEG4AVC/ITU-TH.264视频编码标准因其优异的编码效率和性能而被广泛采用,但其模式决策问题导致运动估计器运算复杂度非常大。本文提出一种快速模式决策算法的实现方法。仿真结果证明,本方法在编码质量降低较小的情况下,能够减少80%以上的编码时间。  相似文献   

11.
基于H.264的多参考帧快速运动估计算法   总被引:1,自引:0,他引:1  
王莉莉  黄晓革  张明 《计算机应用》2009,29(5):1362-1368
在H.264标准中,为提高图像质量和压缩效率,编码器支持7种块类型在多个参考帧中搜索最佳运动矢量。参考代码采用对参考帧逐一搜索的方式,极大地增加了计算复杂度。根据相邻帧间运动矢量的相关性和连续性,使用合成运动矢量来预测最佳的匹配位置。同时,结合分块模式的终止准则可以避免不必要的参考帧搜索。实验表明,较JVT参考模型该算法编码速度能提高6倍以上,同时保证了图像的高质量和低比特率。  相似文献   

12.
H.264中指数哥伦布算法的优化实现研究   总被引:1,自引:0,他引:1  
指数哥伦布算法是H.264视频压缩标准中熵解码的重要组成部分.深入研究了指数哥伦布解码算法,提出了一种优化实现.该实现利用指数哥伦布码字的特性,给出了一种使用计算代替逐个比特读取的解码方式.根据实验数据,使用这种方法可以比JM(H.264参考实现)中的指数哥伦布解码方法提高20%左右的效率.  相似文献   

13.
针对硬件实现的H.264视频编码算法改进   总被引:1,自引:0,他引:1  
从硬件实现的角度分析了H.264算法,重点研究了占用最多运算时间的预测部分的优化,给出了对帧内预测、哈达马变换以及运动估计算法的改进,通过简化运算复杂、效率不高的模块以及减少模块间数据相关性等,对硬件进行优化。通过对各种测试序列的仿真,证明改进是有效的。  相似文献   

14.
针对网络视频传输过程中的版权保护问题,提出基于H.264的自适应活性量化索引调制(AAQIM)水印算法,以块的活性为载体信号,引入自适应机制,采用一个区域嵌入一位水印信息,使误差被块的几个系数分担。实验表明,水印具有良好的不可见性,对后续帧影响小,对重编码、加噪及滤波等攻击具有很强的鲁棒性;水印的提取不需要原始视频,算法简单、调制方便,能够满足实时要求,有较高的实用性。  相似文献   

15.
码率控制是H.264/AVC的一个重要组成部分,它通过调节编码比特流的的码率变化从而在给定的信道带宽下获得持续较好的图像质量。在Nejat Kamaci提出的码率控制算法上进行了改进,增加了宏块级码率控制,并针对传统的平均绝对误差(Mean Absolute difference,MAD)线性预测模型计算量大且存在一定误差的缺点,提出一种新的MAD加权预测模型,降低了算法复杂度和预测误差。实验结果表明,改进算法的码率控制更加准确,并且图像的PSNR值也有所提高。  相似文献   

16.
罗菲 《微处理机》2007,28(5):80-81,85
针对H.264的编码特点,阐述一种菱形块匹配运动估计搜索算法,并采用基于Spartan-Ⅱ系列FPGA的硬件结构实现。通过与全搜索法相比的仿真试验证实该方案达到预期的效果,并且提高了数据吞吐率,简化了硬件结构,极大地节省了资源。  相似文献   

17.
H.264/AVC is the latest standard for video compression and is a significant advance, but at the expense of increasing computing needs. Recently, the progress of GPUs has attracted considerable attention because they are able to offer practical and acceptable solutions for speeding up graphic and non-graphic applications. In this paper, we present an implementation of H.264/AVC Motion Estimation running on an NVIDIA GTX285 using CUDA. The algorithm is divided into three steps, all of which need to be executed sequentially but each one is exploited following a highly parallel procedure by using the GPU. The execution time of the proposed motion estimation algorithm is 53 times faster and it reduces the energy consumption by a factor of 9 compared with the JM reference encoder using a single CPU core.  相似文献   

18.
High efficiency video coding (HEVC) was developed by the Joint Collaborative Team on video coding to replace the current H.264/AVC standard, which has been widely adopted over the last few years. Therefore, there is a lot of legacy content encoded with H.264/AVC, and an efficient conversion to HEVC is needed. This paper presents a hybrid transcoding algorithm which makes use of soft computing techniques as well as parallel processing. On the one hand, a fast quadtree level decision algorithm tries to exploit the information gathered at the H.264/AVC decoder to make faster decisions on coding unit splitting in HEVC using a Naïve–Bayes probabilistic classifier that is determined by a supervised data mining process. On the other hand, a parallel HEVC-encoding algorithm makes use of a heterogeneous platform composed of a multi-core central processing unit plus a graphics processing unit (GPU). In this way, from a coarse point of view, groups of frames or rows of a frame (both options are possible) are divided into threads to be executed on each core (each of which executes one of the aforementioned classifiers) and, from a finer point of view, all these threads work in a collaborative way on a single GPU to perform the motion estimation process on the co-processor. Experimental results show that the proposed transcoder can achieve a good tradeoff between coding efficiency and complexity compared with the anchor transcoder.  相似文献   

19.
We revisit the master-slave tasking paradigm in the context of heterogeneous processors. We assume that communications are handled by a bus and, therefore, at most one communication can take place at a given time step. We present a polynomial algorithm that gives the optimal solution when a single communication is needed before the execution of the tasks on the slave processors. When communications are required both before and after the processing of the tasks, we show that the problem is strongly NP-complete. In this case, we present a guaranteed approximation algorithm. Finally, we present asymptotically optimal algorithms when communications are required before the processing of each task, or both before and after the processing of each task.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号