军事:中美最新超级计算机哪家强称中国已连续六度称雄(5)
互联网 2015-11-17 14:03:25
三是用GPDSP做加速器。国防科大自主研发了矩阵2000以替代Intel的Xeon-PHI,矩阵2000双精浮点达2.4T,功耗200W,虽然离第二代至强PHI双精浮点3T的性能有差距,但性能和性能-功耗比都足以笑傲天河2号正在使用的Intel第一代至强PHI,成为天河2A升级计划中至强PHI计算卡的理想替代品。
GPGPU和GPDSP的优缺点
GPU的大宽度并行结构能做到非常高的理论双精浮点计算能力(英伟达的加速卡K80双精浮点高达2.9TFlops)。但因CPU和GPU的编程模型是不一致,导致GPGPU在编程方面很不方便,只能跑OpenCL、OpenACC、CUDA代码,不能跑OpenMP并行处理的代码。加上GPGPU作为加速卡和CPU是不共享内存,需要程序员显式拷贝,进而导致数据访问速度变慢。因此,GPGPU相对而言编程麻烦、效率相对而言并不高、通用性差,但是性能-功耗比高。
GPDSP是国防科大首创,是应对美国禁售Xeon-PHI的技术储备和秘密武器。国防科大最迟在2013年就开始着手GPDSP的研发工作。今年发布的矩阵2000采用40nm制程工艺,拥有16核,主频1G,双精浮点2.4T,功耗为200W。因此,矩阵2000虽然在性能上因受制于国内的制造工艺和设计水平,在性能上不如GPGPU,但在性能-功耗上已经略优于GPGPU(2.4T/200W 对比 2.91T/300W),而且已经大幅优于天河2号目前使用的第一代至强PHI计算卡(2.4T/200W 对比 1T/300W)。
狂踩
(20)
30.3%
点赞
(46)
69.7%
