周报全文
2008-07-02 15:33    文章来源:网界网

三昧真火熔炼HPC

作者:网界网 鲁媛媛 祁金华


独家视点

零距离观察千万亿次超级计算机

617日,本报记者在IBM位于纽约郊区Poughkeepsie的研发中心,参观了刚刚调试成功的千万亿次超级计算机RoadRunner,从而与人类历史上首台千万亿次计算机有了一次零距离接触。

IBM工程师Don Grice在Poughkeepsie机房调试Roadrunner

IBM工程师Don Grice在Poughkeepsie机房调试Roadrunner

据在场的IBM工程师介绍,这台超级计算机从立项到调试成功,耗费了大概3个月的时间。由于该超级计算机是为Los Alamos国家实验室定制,因此目前还没有加载任何的存储系统,不过其计算功能模块已经齐备。

RoadRunner拥有130536个计算核心,包括12960颗改进版的IBM Cell芯片的116640PPESPE核心,以及6948颗双核心AMD Opteron。与IBM此前位居Top 500首位的蓝色基因不同,此次的RoadRunner采用了刀片服务器集群架构,利用Infiniband技术进行了连接。

记者在现场看到,整个RoadRunner17CUCluster Unit,集群单元)组成,每个集群又包含了16个机柜,每个机柜里面有4台刀片服务器。每台刀片服务器包含了3个混合节点,每个节点由一片LS21 AMD刀片加上两片Cell QS22刀片组成,分别配置了4Cell2颗双核皓龙芯片。两种处理器使用PCI-E电缆连接在一起,而节点之间用Infiniband进行连接。

由于节点数目庞大,因此IBM将连接分成了两个层次,首先将其连接到第一层Infiniband交换机,然后再将其连接到第二层Infiniband交换机,以保证整个系统的可管理性。主计算任务由皓龙来完成,而Cell芯片则起到加速处理的作用。

现场的工程师表示,他们从1CU开始调试,然后逐步进行累加,直至达到Los Alamos国家实验室所要求的计算能力。实际上,他们总共搭建了18CU,不过由于Los Alamos实验室的实际需要,他们只会安装17CU进行运算,另外的一个CU会留在IBM的研发中心。这款全球首台配置了Cell芯片的混合式超级计算机需要三种不同的编程工具,程序员们也必须认真考虑如何让每个节点的十几个颗核心如何高效率地同时运行。

1  2  3  4  
责任编辑:程永来

文章评论

评论加载中...请稍后

精彩专题