排序方式: 共有73条查询结果,搜索用时 406 毫秒
11.
12.
通用矩阵向量乘法(GEMV)函数是整个二级基础线性代数子程序(BLAS)函数库的构建基础,BLAS作为关键基础计算软件之一,目前在申威处理器上却没有一个高性能实现的版本。针对上述问题,为充分发挥申威1621平台的高性能BLAS库计算优势,提出一种基于申威1621的通用矩阵向量乘法的性能分析与优化方法。首先对GEMV函数进行计算重排序、循环分块的改进;然后采取单指令多数据流(SIMD)以及指令重排的优化方式;最后对内存分配方式进行择优选择。测试结果表明,GEMV函数平均性能达到GotoBLAS版的2.17倍。在使用堆栈分配内存空间或增加对y向量步长的判断分支两种方案后,相较于GotoBLAS,小规模矩阵的平均性能由2.265倍提升至2.875倍。为提高大规模矩阵的性能,以及发挥申威1621多核处理器并行机制,在开启4线程后,平均性能达到单核的3.57倍。因此,优化后的GEMV函数在申威平台上较好的体现了并行效果。 相似文献
13.
既有建筑正常使用性鉴定初探 总被引:1,自引:0,他引:1
既有建筑的可靠性鉴定划分为安全性鉴定和正常使用性鉴定,本文通过工程鉴定实例探讨了既有建筑正常使用性鉴定方法,对既有建筑的可靠性鉴定有一定指导作用。 相似文献
14.
建立了实用有效的水力空化装置,设计简单,易于操作,容易放大到工业应用的水力空化反应器-多孔板;分析了水流空化数、修正空化数对羟自由基浓度的影响,研究了羟自由基产量与空化强度的关系,寻求最优空化强化条件。 相似文献
15.
随着工农业生产和人民生活对用电质量要求的不断提高,对电压合格率的要求也越来越高。本文就针对调度自动化主站OPEN2000系统这一特点,结合国网开封供电公司的实际情况,就如何通过开发简单程序,提高电压合格率统计工作的自动化程度,做定向分析,希望为一些供电企业提供技术经验。 相似文献
16.
17.
18.
19.
为了有效解决二进制搜索算法标签识别延时过长的问题,提出了二进制搜索算法的一种改进算法,通过设置堆栈,变量Count,引入了反向搜索的机制.仿真试验结果表明该改进算法显著地减少了读写器向标签发送的请求次数,解决了二进制搜索算法延时过长的问题,提高了标签识别的效率. 相似文献
20.