首页 | 官方网站   微博 | 高级检索  
     

基于多核DSP的矢量高效QR分解技术
引用本文:张宇帆,陈 颖,方 科,费 霞.基于多核DSP的矢量高效QR分解技术[J].电讯技术,2023(4):536-543.
作者姓名:张宇帆  陈 颖  方 科  费 霞
作者单位:中国西南电子技术研究所,成都 610036;敏捷智能计算四川省重点实验室,成都 610036
摘    要:以多核数字信号处理器(Digital Signal Processor, DSP)作为计算节点的多核DSP集群系统成为一大发展趋势。当前阶段,由于多核DSP内核硬件资源利用不充分与访存带宽限制,峰值性能与实际性能间存在鸿沟。基于C66x内核丰富的指令集架构以及运算指令编排原则,结合编译器提供的汇编信息,设计并优化了QR分解算法,在充分挖掘DSP单核性能极致的同时减少了矩阵分解的计算时间。根据掌握的优化技术,设计并实现基于多核DSP集群系统的大规模并行QR分解模型,并在分布式计算框架上完成了分解任务。分析结果表明,优化后的QR分解计算效率以及C66x单核硬件资源使用率均提升了二十余倍,随着待分解矩阵规模的成倍增加,多核DSP集群相比于单核的计算性能提升也愈加明显。

关 键 词:多核数字信号处理器(DSP)  QR分解  软件优化  分布式计算

High efficient QR decomposition by vector technology on multi-core DSP
ZHANG Yufan,CHEN Ying,FANG Ke,FEI Xia.High efficient QR decomposition by vector technology on multi-core DSP[J].Telecommunication Engineering,2023(4):536-543.
Authors:ZHANG Yufan  CHEN Ying  FANG Ke  FEI Xia
Affiliation:Southwest China Institute of Electronic Technology,Chengdu 610036,China;Sichuan Key Laboratory of Agile Intelligent Computing,Chengdu 610036,China
Abstract:
Keywords:
点击此处可从《电讯技术》浏览原始摘要信息
点击此处可从《电讯技术》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号