首页 | 官方网站   微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   9篇
  免费   2篇
  国内免费   2篇
工业技术   13篇
  2021年   1篇
  2014年   1篇
  2013年   1篇
  2012年   2篇
  2011年   2篇
  2010年   2篇
  2009年   2篇
  2008年   1篇
  2007年   1篇
排序方式: 共有13条查询结果,搜索用时 15 毫秒
1.
何颂颂 《福建电脑》2021,37(4):102-104
受到疫情的影响,视频会议系统的使用率直线攀升,会议系统的服务器压力越来越大。为了缓解服务器的压力,本文提出了一种通过分级代理和P2P技术来降低服务器计算、存储和网络资源消耗的方法。  相似文献   
2.
双精度普通矩阵乘法DGEMM是BLAS库中最核心的函数之一,大部分三级BLAS库函数的核心计算都是通过调用DGEM M来实现的.该文针对龙芯3A具有128位访存指令的特点,通过理论分析,找到了最佳的循环展开方式;针对龙芯3A的Cache替换策略(随机替换),通过使用地址交错技术,减少了Cache的冲突失效;针对龙芯3A访存带宽有限的问题,通过使用共享数据的任务划分方式,减少了数据访存量.优化后的DGEMM单核和多核运算速度均是性能最高的开源BLAS库(Goto-BLAS)的2倍多.  相似文献   
3.
随着各领域需要处理的数据量越来越大,数据密集型应用也变得越来越被重视.该文提出一种包含数据访存层次和访存冲突等信息的新并行程序执行模型PSRAM(h).针对数据密集型应用以访存为主的特点,PSRAM(h)模型将程序执行时间简化为访存时间,通过分析各程序子段的访存层次和数量来预测串行程序的执行时间,进而通过使用各线程执行时间的最大值来预测并行程序的执行时间.使用PSRAM(h)模型下对最典型的数据密集型应用矩阵向量乘进行分析,在龙芯3A处理器和Intel Xeon E5520处理器两个平台上的测试结果表明,PSRAM(h)模型分析结果与实测结果大部分情况下误差小于20%.由此可见,针对数据密集型应用,PSRAM(h)不但可以给出程序执行时间的下限,还可以有效的预测程序的执行时间.  相似文献   
4.
P2P搜索效率跟P2P用户的特性相关,本文将基于P2P用户的群聚特性,在纯P2P网络之上,构建基于用户兴趣的覆盖网络,并设计相应的资源搜索策略.本文通过计算节点间的相似度来构建覆盖网络,根据查询请求和节点的相关度来决定搜索策略并从理论上证明了本文提出的搜索算法的性能优于随机漫步和简单洪泛.实验结果显示,本文提出的搜索算法的平均搜索时间和消息复杂度均优于随机漫步搜索算法.  相似文献   
5.
针对龙芯3A体系结构,通过底层BLAS库的优化、LAPACK分块算法中分块大小的改善以及LAPACK函数的单独优化这三种途径来提升LAPACK函数的性能.用LAPACK自带的性能测试程序进行测试,实验结果表明,有240个LAPACK函数的性能提升达到30%以上,占全部性能测试函数的81%.  相似文献   
6.
现有的P2P搜索算法对资源特性考虑较少,文中充分考虑了资源的密度信息对搜索效率的影响,设计了动态的密度调节策略和动态的智能节点管理方案,并基于此提出了改进的多路随机算法SNKR。SNKR算法的设计基于资源密度信息,并且使用智能节点协助搜索,具有较小的消息复杂度。实验仿真结果显示,与简单多路随机算法相比,SNKR在搜索时间上改进约10% ̄40%,同时很好的控制了总的消息数和重复访问节点的比例。  相似文献   
7.
在无结构P2P网络中,资源密度影响搜索算法的搜索时间、通信开销以及搜索策略的设计与选取.在资源随机分布的假设下分析了资源密度同搜索性能的关系,给出了随机漫步和洪泛搜索的平均搜索时间和通信开销下界,并分析得出结论:增加资源备份或者降低节点被重复搜索的概率能显著提升稀有资源的搜索性能,但较难提升稠密资源的搜索性能.基于上述理论分析,提出了一个随机漫步改进算法以验证结论.仿真实验表明,实验数据同理论分析结果符合.  相似文献   
8.
针对无结构P2P网络中稀有资源搜索成功率低、搜索代价高的问题,提出2种基于网络覆盖的稀有资源搜索策略:RSR和FRSR RSR在随机漫步的基础上通过考虑邻居节点的热度改进请求转发方式,FRSR通过结合洪泛搜索改进随机漫步转发策略。实验结果表明,RSR搜索稀有资源的时间比普通随机漫步减少了22.9%,平均搜索成功率提高了26.2%,通信开销降低了22.8%,FRSR比随机转发方式减少了15.4%的搜索时间,提高了14.2%的搜索成功率。  相似文献   
9.
多核龙芯3A上二级BLAS库的优化   总被引:1,自引:0,他引:1  
针对龙芯3A体系结构以及二级BLAS库函数的特点,在指令级、存储级和线程级抽取并行方案,总结了一些合适的优化方法,并对其进行了定量的分析.实验表明,这些优化可以将二级BLAS函数单线程的性能提升20%以上,多线程下也可以得到2.5倍左右的加速比,这对今后多核龙芯上的系统软件优化工作有着一定的帮助.  相似文献   
10.
裴晓航  何颂颂 《电子技术》2010,37(10):88-90
本文实现了ffmpeg解码器到龙芯3B平台的移植,并针对龙芯3B所支持的向量扩展指令,对ffmpeg解码器进行了向量化。实验结果表明:实现向量化的ffmpeg解码器,其性能比使用GCC向量化编译得到的ffmpeg解码器具有更好的性能,而且性能提升的比率比在一些商业平台上更大。  相似文献   
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号