跳上超级计算机这辆战车

时间: 2005-12-26 09:16:47    来自:互联网周刊
 

    微软的高调登场和IBM"蓝色基因"的风光无限已经充分说明,在弥漫着浓重速度情结的超级计算机领域,追逐极限和挑战记录依然是谁也无法回避的主旋律

    当盖茨1115"令人吃惊"的出现在美国西雅图举行的"2005年超级计算机大会"SC05)会场,并做了演讲时,绝大多数人已经意识到,微软准备介入超级计算机领域的想法很快就要变为现实。按照盖茨宣布的计划,微软专门针对高性能计算环境开发的操作系统Windows Compute Cluster Server 2003(即Windows Server 2003的集群版)目前已进入了β2版的测试阶段,正式版最早将会在20061月推出。"此前,UnixLinux是高性能计算机(HPC)系统中占据绝对优势的操作系统,而集群的流行给了Windows机会。"

  集群打开"探索之门"

    的确,如盖茨所提及的"集群的流行",正是HPC在最近20年发展历史中的显著变化之一。来自劳伦斯·伯克利国家实验室(LBNL)的豪斯特·西蒙博士(Dr. Horst Simon)前些天在美国加州伯克利大学校园里举办了一场关于HPC发展历程的讲座,他认为,自1985年到现在,和当时处于向量机时代的超级计算机Cray-2相比,如今的超级计算机毫无疑问已经有了天翻地覆的变化。

    "低成本实现万亿次flopsflops是计算每秒处理器可处理多少浮点运算的单位),高度相似并且像日用品一样大量出现的集群,开源软件和社区内共享的代码,以10Gbit/s带宽连接的网格,功能强大的可视化系统,以及桌面系统中更高效的开发环境等等,这些都是HPC领域在2005年的鲜明特点。"豪斯特博士是设在LBNL中的美国国家能源研究所科学计算中心(NERSC)主任,同时也是一年发布两次的全球超级计算机TOP500排行榜的四位作者之一。

    而从SC05公布的最新一期也是第26TOP500榜单上也能看出,集群的流行已经是不争的事实。据TOP500官方网站提供的统计数据称,全球运算速度最快的500台超级计算机中,有360台均采用了集群体系,这也是目前最普遍和最流行的架构。三年前,这一数字仅仅为93台。在这一过程中,如英特尔和AMD这样的芯片制造商的积极推动,无疑起到了至关重要的作用。

    两年前,英特尔还是在TOP500中排在IBMHP之后的第三大处理器供应商,而现在,总共已有333台超级计算机选择了英特尔的芯片,使英特尔当之无愧的成为了第一大处理器供应商,其中包括81台使用了基于英特尔EM64T技术的64位处理器和46台使用了英特尔安腾2处理器。这样的成绩已经遥遥领先于IBM Power芯片的73台和AMD Opteron芯片的55台。

    "高性能计算的差异性正在大幅度缩小,这会使高性能计算的标准化产品获益。"许多分析人士都觉得,日益标准化、模块化的设计也使得超级计算机的成本和技术门槛越来越低,往日里那些动辄上亿美元的笨重机器也渐渐变得不再神秘。两年前出现在TOP500排行榜上,并且占据第三位的,居然可以是一台由美国维吉尼亚科技大学的学生用1100台双CPU的苹果G5搭建出来的"怪物"。而今年SC05大会的主题恰恰就是"探索之门"Gateway to Discovery),在某种意义上,集群的出现和大面积流行也正是打开"探索之门"的强劲动力。

    微软的到来无疑也证明了这一点。微软已经明确表示,其进入高性能计算市场的目标之一就是要为中小型用户带来更便宜和更易用的超级计算机。在明年年初发布Windows Server 2003集群版之后,微软还将资助美国、欧洲和亚洲的10所大学,并且和他们共同开发包括操作系统、中间件和开发工具在内的高性能计算产品。尽管目前一些专家对于超级计算机的体系结构向何方发展还存有争论,比如中科院计算所副所长樊建平就曾经明确表示:"从可扩展性、可用性的角度,可以说集群式体系结构已经走到了尽头。"不过从另一方面来看,其实也很难说清楚,集群体系的流行到底是HPC演变的推动因素还是方向。
 
 
挥之不去的速度情结

    和第25TOP500的排名相比,在最新一期的榜单上最引人关注的变化,还要算是排在第一位的"蓝色基因/L"。虽然这台安装在美国能源部(DOE)的劳伦斯·利弗摩尔国家实验室(LLNL)中的大家伙已经是第三次蝉联了全球最强大超级计算机的头衔,但其LinpackLinpack是国际上最流行的用于测试高性能计算机系统浮点性能的bechmark。)实际运算速度从一年前刚刚排名世界第一时的70.72万亿次flops至今,已经翻了两倍,达到了280.6万亿次flops,基本每6个月就会翻一倍。在第25期榜单上,"蓝色基因/L"Linpack实际运算速度为136.8万亿次flops

    可以说,IBM始于1999年的"蓝色基因"计划,自200411月推出其商业版本以来,逐渐步入了收获期,至今共有19"蓝色基因"系统出现在TOP500榜单上,当初近2亿美元的预算看来的确物有所值。更重要的是,由IBM制造的超级计算机目前已经包揽了这份榜单的前三名。除了"蓝色基因/L"之外,IBM安装在自己公司位于纽约的托马斯·约翰·沃森研究中心的"沃森蓝色基因系统"BGW)以91.29万亿次flops的运算速度排在第二位,最近刚刚在LLNL亮相的ASC Purple超级计算机,以63.39万亿次flops的成绩紧随其后。

    按照IBM原来的计划,研发新一代超级计算机"蓝色基因"的最初目标主要是应用于人体蛋白质的研究领域,如利用物理学原理来分析蛋白质中DNA分子链的长度等等。后来,IBM一面和全球众多重量级的研究机构建立合作,一面也把"蓝色基因"的优势逐步扩展到了商业领域。"在商业领域有三个大方向的应用,一是石油勘探中对地震数据的具体分析;二是投资风险界的一些计算分析;另外还有生命科学领域对药物结构的研究分析。"IBM工程技术服务部蓝色基因系统解决方案全球总监Ralph Warmack博士在不久前访问中国时对记者说。

    其实,IBM"蓝色基因"计划还有一个更直接的目的,就是为了和日本NEC公司制造的超级计算机"地球模拟器"Earth Simulator)争夺制高点,其背后也暗暗延续了美日争霸的意味。从20023ES正式在日本横滨服役以来,其35.86万亿次flops的运算速度在两年半的时间内始终无人超越,这让号称"计算大国"的美国非常尴尬。如今,ES已经被安放在美国的6台超级计算机挤到了TOP500排行榜的第7位,6个月前,ES还停留在第4位。

    不过,同样号称"计算大国"的日本并不会甘心被人超越。今年7月,日本共同社发布消息说,日本政府将从2006年开始建造一台每秒将可进行1000万亿次运算(1Petaflop)的新型超级计算机,预计耗资800亿日元到1000亿日元,计划在2010年建成。而实际上,"蓝色基因/L"也只是开始。IBM一年前就已着手设计用于Cyclops的芯片,而Cyclops就是"蓝色基因/C",它是"蓝色基因/L"的后续产品。在"蓝色基因/L""蓝色基因/C"之后还有千万亿次超级计算机"蓝色基因/P"。可以预计的是,在2010年前后,美国和日本的计算机制造商势必又将要为争夺全球运算速度最快的计算机这一头衔展开激烈争夺。

    而对于中国超级计算机领域的发展,似乎还处于寻找应用的探索阶段。"不要太看中这个排名(指TOP500),超级计算机首先在一定程度上反映了我们的计算实力,"中科院计算所所长李国杰院士在接受采访时说,"但排名只是根据解线性方程式(即Linpack)一个角度进行的,并不反映实际的运行效率。"而实际的运行效率背后必然是真真切切的应用,这恰恰也是高性能计算受全球各国高度重视的根本原因。

    在这一过程中,"跟随战略"很难避免。"我们目前在高性能计算领域方面有了一定的核心竞争力,但是还有不少短板,这些短板需要不断组织力量修补。"因为有中科院计算所的背景,曙光公司在国内的HPC领域有着相当高的知名度,其总裁历军在接受记者采访时认为,其实从整体上说,曙光和国外巨头们的产品并没有多少区别,基本处于同一水准,但"在一些核心部件的开发和自主创新,以及前瞻性的研究方面,还有比较大的差距。我们毕竟看得没有人家远。"

 
期期必出30码网站