排序方式: 共有13条查询结果,搜索用时 15 毫秒
1.
受到疫情的影响,视频会议系统的使用率直线攀升,会议系统的服务器压力越来越大。为了缓解服务器的压力,本文提出了一种通过分级代理和P2P技术来降低服务器计算、存储和网络资源消耗的方法。 相似文献
2.
双精度普通矩阵乘法DGEMM是BLAS库中最核心的函数之一,大部分三级BLAS库函数的核心计算都是通过调用DGEM M来实现的.该文针对龙芯3A具有128位访存指令的特点,通过理论分析,找到了最佳的循环展开方式;针对龙芯3A的Cache替换策略(随机替换),通过使用地址交错技术,减少了Cache的冲突失效;针对龙芯3A访存带宽有限的问题,通过使用共享数据的任务划分方式,减少了数据访存量.优化后的DGEMM单核和多核运算速度均是性能最高的开源BLAS库(Goto-BLAS)的2倍多. 相似文献
3.
随着各领域需要处理的数据量越来越大,数据密集型应用也变得越来越被重视.该文提出一种包含数据访存层次和访存冲突等信息的新并行程序执行模型PSRAM(h).针对数据密集型应用以访存为主的特点,PSRAM(h)模型将程序执行时间简化为访存时间,通过分析各程序子段的访存层次和数量来预测串行程序的执行时间,进而通过使用各线程执行时间的最大值来预测并行程序的执行时间.使用PSRAM(h)模型下对最典型的数据密集型应用矩阵向量乘进行分析,在龙芯3A处理器和Intel Xeon E5520处理器两个平台上的测试结果表明,PSRAM(h)模型分析结果与实测结果大部分情况下误差小于20%.由此可见,针对数据密集型应用,PSRAM(h)不但可以给出程序执行时间的下限,还可以有效的预测程序的执行时间. 相似文献
4.
P2P搜索效率跟P2P用户的特性相关,本文将基于P2P用户的群聚特性,在纯P2P网络之上,构建基于用户兴趣的覆盖网络,并设计相应的资源搜索策略.本文通过计算节点间的相似度来构建覆盖网络,根据查询请求和节点的相关度来决定搜索策略并从理论上证明了本文提出的搜索算法的性能优于随机漫步和简单洪泛.实验结果显示,本文提出的搜索算法的平均搜索时间和消息复杂度均优于随机漫步搜索算法. 相似文献
5.
6.
现有的P2P搜索算法对资源特性考虑较少,文中充分考虑了资源的密度信息对搜索效率的影响,设计了动态的密度调节策略和动态的智能节点管理方案,并基于此提出了改进的多路随机算法SNKR。SNKR算法的设计基于资源密度信息,并且使用智能节点协助搜索,具有较小的消息复杂度。实验仿真结果显示,与简单多路随机算法相比,SNKR在搜索时间上改进约10% ̄40%,同时很好的控制了总的消息数和重复访问节点的比例。 相似文献
7.
8.
9.
10.
本文实现了ffmpeg解码器到龙芯3B平台的移植,并针对龙芯3B所支持的向量扩展指令,对ffmpeg解码器进行了向量化。实验结果表明:实现向量化的ffmpeg解码器,其性能比使用GCC向量化编译得到的ffmpeg解码器具有更好的性能,而且性能提升的比率比在一些商业平台上更大。 相似文献