“2015,进军全球科技创新中心”系列① 超算谋变:云模式撬动社会资源

26.01.2015  02:02

  上海超级计算中心正在推进一场深刻变革。作为支撑上海创新的“超级大脑”,上海超算的主机曾两度入选全球最快计算机榜单十强,但如今,他们或许不再一味追求计算速度,而是要借助互联网思维,在修炼内功的基础上,将社会上散落的“小超算资源”化零为整,整合成为一台架在互联网“云端”的超级计算机,从而让众多中小企业能获得低成本、高效能的计算服务。

  这不是一次单纯的技术变革,更是对创新体制的探索。目前,国内所有超级计算中心都完全靠政府投入巨资建设,普遍缺乏自身造血机能,为持续发展留下隐患。在国家越来越强调创新资源由市场配置的背景下,它们该如何发展?是否可以撬动社会力量,真正在服务产业中找准自身定位,并开辟出公共技术服务的新模式?

  作为国内第一家超算中心,组建15年的上海超算有责任率先谋变,现实的压力也逼得他们必须谋变。

   资源瓶颈

  2009年6月,上海超算上线不久的主机“魔方”荣登全球最快计算机排行榜Top500的第十名。六年过去了,“魔方”依然在跑。

  上海超算有理由感到骄傲——当年一同入选全球500强的计算机中,“魔方”是唯一还在运行的。超级计算机通常是7×24小时高负荷运转,“魔方”早该退休,它的超长寿命凸显出上海超算中心世界级的运维能力。

  但骄傲之外更有尴尬。“魔方”如今的全球排名已经退居到360位。按照几年来其排名下滑的曲线推算,今年底,“魔方”将排在501位,恰好退榜。

  “魔方”滑落的同时,国内其他第三方超级计算中心的发展却在政府支持下进入“牛市”,单台主机运算能力连续进入世界前三、直至第一。目前,全国超算的总运算能力已超过每秒65P次(1P等于1千万亿),其中80%出现在过去18个月。而“魔方”进入世界前十时,速度仅为每秒0.2P。

  计算资源的爆棚式增长并没有带来其他超算中心的模式更新。目前,他们基本沿袭了上海超算15年前成立时的模式——政府投入一次性建设资金,建成后,大部分计算资源以极其低廉的价格提供给基础研究。

  在上海超算的黄金时代,这种模式还可以支撑——“魔方”投资约2亿元。但随着超级计算机越来越快,新一代100P级的主机,其初期投资已骤增至30亿元以上,加上每年数亿元的电费消耗、人员成本和设备折旧,高度依赖财政投入的模式,对此类创新基础设施的可持续发展提出了挑战——像“魔方”这样支撑6年的主机毕竟前所未有,大部分主机在四五年后必须更新。

   模式创新

  业内常说,中国超级计算机速度虽然领先世界,但仍称不上强国,主要瓶颈包括应用软件的限制、人才不足等。上海超算对此都深有体会,改革也就从这些环节寻找突破口。

  超级计算对产业创新意义重大,比如,超级计算机可以在虚拟世界中完成新车研发必须的碰撞试验,从而将需要实打实撞坏的真车减少90%。类似的模拟还可以支持发动机、芯片、建筑、化工等研发。

  但在服务企业时,超级计算应用软件极其昂贵,一般达硬件的5到10倍,而且须按计算任务所需的硬件规模购买相应数量的软件授权。但超算中心在初期投入之外,很难拿出一笔巨资购买软件。在这种限制下,全国的超级计算机目前多数被用于支持基础研究,因为这部分科学计算大都可使用免费的开源软件。

  如果要更好地服务企业,在目前的状况下,超算中心必须在模式上有所创新。

  上海超算中心副主任李根国告诉记者,此前,他们已与本市一些大型企业合作,由对方共享出自己的软硬件资源,超算中心则回报以租金,上海核工程研究设计院就是其中之一。

  该院信档中心副主任何炳海告诉记者,核工院是国内核电站领域实力最强的设计单位,拥有国内最完备的核电相关计算资源。这些资源是按他们的峰值需求采购、配置的,闲暇时完全可以共享出来:“这是核工院主业之外的新盈利渠道。”据透露,除了核电工业,这类软件也是不少装备制造企业急需的。

  这种带有“众包众创”的互联网特征的合作,目前在钢铁、汽车、航空等领域也都有了雏形,相关龙头企业都有意愿共享资源。其结果是,上海超算不必一次性将机器、软件等配置到位,资金压力急剧下降。对社会而言,在不显著增加政府财政投入的前提下,服务创新的环境也可以有效改善。

   走向工业云

  按照“云转型”的方向,上海超算目前正围绕技术和运营模式完善创新细节。

  周曦民说,上海超算一直是按照自收自支的事业单位性质运营,政府部门对其预算、人员等严格管理,限制了该中心随时拓展资源、服务中小企业的能力。但使用超算不像用Word编写文档,需要一定的知识,目前上海超算对用户执行“一对一”服务,也就是说,每个企业用户都要配置一个专门的服务人员,这种手工配置模式,即便能提供云服务,效率依然不高。

  上海超算服务过数百家企业,最小的只有十几名员工,但总体上,迫于人才缺口,上海超算一直无法全面服务小微企业,这与社会需求形成了鲜明反差。事实上,企业越小,自身购买计算资源的可能性越低,相关能力和经验越少,就越需要社会提供高效的第三方计算服务。

  另外,当上海超算整合社会资源后,企业用户会担心将项目放在别家、甚至可能是对手的主机上运算存在泄密风险。相应的,输出资源的大企业也难免怀有安全疑虑。

  针对以上障碍,上海超算正通过技术方式加以解决,目前相关研发进展顺利,并得到市经信委的支持,被纳入不久前启动的上海“工业云”试点。据透露,今年下半年,上海超算的“工业云”就能正式上线。

选稿:赵娉晔   来源:文汇报   作者:张懿