上海超级计算中心:老“魔方”的新式“玩法”

24.02.2015  09:36

  2月24日消息:冬春之际,雾霾易发,能不能“预算”出次日乃至未来几日的空气质量?近日,上海市环境监测中心与上海超级计算中心合作,建设长三角区域空气质量预测预报中心,为各省市提供区域性大气污染的预报预警服务。其间产生的海量数据,少不了高性能计算及存储条件,离不开上海超算中心的主打机型“魔方”。

  然而,在最新一届全球超级计算机“TOP 500”榜单上,曾位列世界第十、亚洲第一的“魔方”机型,先后被“天河一号”、“天河二号”等更快机型超越,目前在“超算五百强”中仅仅排在第360名,并且成了服役年龄最大的上榜者。作为国家和城市创新竞争力的象征之一,上海超级计算机如何在建设全球科创中心的背景下,实现新的转型与二次创业?

   后来居上,不进则退

  在位于张江的上海超算中心主机房内,由几十个机柜列阵组成的“魔方”机组仍在坚持工作,但监控屏幕上的小片灰色默默显示着它的“力不从心”。“灰色区域就是坏掉的计算单元,如果修不好,我们就会拔除其与并行系统的连接,以免影响其他部分运算。”上海超算中心首席科学计算工程师王涛告诉记者,如今这样的灰色区域正逐渐变大。

  “魔方”在短短6年内经历了一段硬件兴衰史。2009年,上海超算中心引入国产超级计算机“魔方”。这台造价2亿元、每秒峰值运算速度超过200万亿次的超级电脑,以“中国速度”的光环加身。投运第一年,就两度跻身全球超算五百强前十。然而仅隔一年,另一套国产超算系统“天河一号”以每秒运算2570万亿次的实测速度首登全球榜首,落成于广州的“天河二号”更是在随后几年中以每秒运算33860万亿次的数量级“超速度”,再次代表中国问鼎全球,至今已四度蝉联世界上最快电脑的名号。

  在日新月异的超级计算机领域,几乎每天都在上演一次重新洗牌。仍维持“百万亿次”运算水平的“魔方”,比起“千万亿次”甚至“万万亿次”的后来居上者,正处于不进则退的窘境中。

  上海超算当年还是全国首个面向社会开放的高性能计算公共服务平台,而当国内“千万亿次”的超级计算机纷纷落户广州、天津、深圳、济南等地,从上海投奔其他超算中心、乃至自建超算中心的想法在一些重要用户的头脑中萌生。

   求速度,还是求应用

  业内人士清楚,在超级计算机这个圈子里,追求速度是“没底的”。其实这与消费级电脑产品类似,作为超级电脑的超算机,其更新换代、优胜劣汰的速度更快,甚至超越了“每18个月翻一番”的摩尔定律。

  在此意义上,没有算得最快的超算,只有用得最好的超算。打个比方,iPhone6比iPhone5快,但一台装有各类最佳APP应用的iPhone5,要比一台只有预装程序的iPhone6更有用。

  这种用好用足超算资源的发展观,在圈内越发流行。对最新的第44届全球超算五百强榜单分析可知,相比于1993年首次发榜以来的硬件加速趋势,这一次全部500台机组的性能增速显著放缓,处于近年来的最低位。可以说,这是对业界“重硬轻软、速度放空”现象的一种回拨。

  因此,对于不免带着“先天缺陷”的上海超算中心,提高软件水平,拓展新型应用,正是其“二次创业”的转型机遇。

  事实上,无论是气象天文、地质勘探、石油开发等传统大规模科学与工程计算领域,抑或是汽车碰撞、药物筛选、基因研究等新兴领域,都离不开高性能计算的基础性支撑。作为科技创新三大手段中的“计算模拟”环节,上海超算中心是沪上唯一平台,为科创中心建设提供了重要支点。如ARJ21-700支线飞机、大型客机C919的设计项目,都在上海超算中心开展了大量虚拟安全分析与仿真模型计算。

  长三角区域空气质量预测预报中心的高性能计算项目,正是未来上海超算中心的新应用与新动向之一。作为大气污染联防联控的重要支撑,超算中心将解析未来7天长三角30个地区的17种污染物成分,涉及汽车、电厂、居民源、钢铁水泥、其他燃煤与生物质燃烧等十大行业。最终,为老百姓回答“空气污染的具体成分是什么”、“由本地产生还是从外地吹来”、“何时会来又在何时缓解”。

  上海超算中心主任周曦民认为,此举不仅将有效推动空气污染防治,也将促进上海超算中心本身的业务能力发展——从单一的高性能计算服务业务,向高性能计算与大数据、云计算相结合的多重业务,并向基于网络的集群计算业务发展。

  同样,上海超算中心还拟承接上海市海洋信息中心关于海洋数值计算的业务,通过对台风、污染物、溢油等数据模型的运算处理,提供48小时溢油扩散应急预警、168小时盐水入侵预报等。

   求规模,还是求协同

  随着超级计算机的“普及化”,超算中心在各地开花,机群规模日益大型化。超级计算机无论其建设费用还是其开机后的运维管理费用,都是一笔巨大开支。若各大高校院所及企业均自行建设超级计算机,那需要一笔天文数字的经费才能满足。

  以较早的上海超算中心为例,运行至第15个年头,累计硬件投资为5.48亿元,目前一年所需电费逾2000万元。下转◆3版(上接第1版)而新建的国家级超算中心,一期建设费用可达25亿元,电费更是每年近亿元。

  显然,不分地域大批布局超算中心并非上策。为此,上海超算中心依然坚持集中公共财政,集约建设一个计算资源密度较高的中心,在深挖潜力上做好文章。

  例如长三角区域空气质量预测预报,其数值预报系统每日运行2次。“如果我们在每日早晚各半小时均有一次天气数据的计算,那么剩下的时间可以干什么?”王涛说,很多应用学科难以在8小时内完成全部数据的计算任务,因此可以见缝插针在此期间放置其他中小计算任务。另一方面,中心为填补“魔方”阵列使用中的不足部分,已引入中小规模的“蜂鸟”集群计算平台,与各工业领域项目协同,进行辅助计算服务。

  而上海超算中心的主要协同创新方向,正是指向工业领域。尽管上海超算中心的用户累计已逾1000家,但科学用户与工业用户的占比仍十分悬殊。根据其年度报告,在用户机时统计中,高校及基础研究院所的用户分别占比50%与38%,工业企业仅为8%,大有潜力可挖。

  规模独大不如协同共享。上海超算中心也在策划市场化之路,并利用这部分营收支撑了部分运营费用。比如上海核工程研究设计院就与上海超算中心协商,成为上海超算分中心。由超算中心在核工院内代建一个小规模超算机房,机房资源与中心资源专线互联,当大型计算任务来临,系统可自动将作业迁移至中心平台上。在“1+N”分中心模式基础上,上海超算成为沪上“工业云”用户联盟之一,合纵连横共建云计算生态环境,为工业用户提供第三方计算服务。

  从全部依靠政府投入转向政府投入与市场投入相结合的建设模式,从政府投入为主转向政府购买服务与市场运作相结合的运营模式——转型路上的“魔方”,也可以转得更顺更快。