军事:中美最新超级计算机哪家强称中国已连续六度称雄(6)
互联网 2015-11-17 14:03:25
GPDSP相对于GPGPU更接近于CPU,可以独立运行OS(Linux或其它实时内核),在编程方面比GPGPU稍微容易一些(其实相对于CPU两者编程难度都很大)。矩阵2000也是带分支能力的众核处理器,和Xeon- PHI是相似类型计算卡,理论上讲,扩充一些GPDSP编译指导语句也能跑OpenMP代码。当然,GPDSP也能跑OpenCL、OpenACC并行处理代码(异构代码)。
因此,GPDSP虽然在性能上不如GPGPU,但在性能-功耗上已经略优于GPGPU(2.4T/200W 对比 2.91T/300W),在效率和通用性方面优于GPGPU。
GPGPU相对于GPDSP处于先天劣势
据了解,美国的2台新超算将于2017—2018年被安装在劳伦斯利物莫国家实验室和橡树岭国家实验室,这两台超算将采用IBM和英伟达的产品,理论浮点计算能力都超越100Pflops,将会是天河2A、新一代曙光超算冲击世界第一的强有力竞争对手。
那么,相对于走GPGPU路线的美国新超算Sierra和Summit,国防科大的GPDSP和美国的GPGPU孰优孰劣呢?
GPU在做并行计算时,传统渲染架构中的TMU、 ROP等特性毫无用处,反而占用了晶体管资源。DSP是纯粹向量机,不像GPU那样有光栅化渲染占晶体管,影响管线结构。
虽然GPU是大宽度并行结构,高端GPU的资源集成度非常高,能很容易做到非常高的理论双精浮点计算能力,但在彼此工艺和集成能力相当的情况下,舍弃图形部分的DSP的晶体管效率更高,而且访存效率也高于GPU传统图形渲染管线那种绕弯子的访存方式。
狂踩
(20)
30.3%
点赞
(46)
69.7%
