第二届中国SKA科学数据处理学术年会在复旦大学举行
12月22日至24日,第二届中国SKA科学数据处理学术年会在复旦国际学术交流中心举行。中国科学院国家天文台副台长郝晋新,中国500米口径球面射电望远镜工程(以下简称FAST工程)副经理、SKA中方科学董事、中国科学院国家天文台研究员彭勃,FAST工程副总工程师、“千人计划”专家、国家天文台射电天文研究部首席科学家、研究员李菂,中国科学院国家天文台信息与计算中心主任、中国虚拟天文台项目负责人、国家天文台-阿里云天文大数据联合研究中心主任、国际天文学联合会数据驱动的天文科普教育工作组主席、研究员崔辰州,中国SDP联盟总体组副组长、中国科学院国家天文台研究员陈学雷,中国科学院国家天文台研究员秦波,山东省超算中心主任、中国计算机学会常务理事/高性能计算专业委员会秘书长、中国计算机学会大数据专家委员会副秘书长、中国科学院计算技术研究所研究员张云泉,“神威”系列超级计算机应用系统负责人、国家超级计算无锡中心总工程师国家并行计算机工程技术研究中心总工程师刘鑫,北京比特大陆公司副总裁、博士于明扬,复旦大学计算机科学技术学院副院长、教授赵一鸣,科技部国家遥感中心SKA办公室主管吕唯佳,以及来自天文、大数据、超算、高性能计算和人工智能等领域的近百位专家学者参加。中国SDP联盟执行委员会主任、SKA中国专家委员会委员、上海市数据科学重点实验室副主任、教授斯雪明主持会议开闭幕式。
本届学术年会由SKA中国科学数据处理联盟(以下简称中国SDP联盟)主办,复旦大学计算机科学技术学院和上海市数据科学重点实验室共同承办,北京比特大陆公司和浪潮集团共同赞助。大会由郝晋新、彭勃、复旦大学计算机科学技术学院院长王晓阳、上海市数据科学重点实验室主任朱扬勇等组成指导委员会;斯雪明担任主席;中国SDP联盟首席数据科学家、复旦大学计算机科学技术学院副教授池明旻,中国SDP联盟首席架构师、中国科学院上海高等研究院研究员祝永新共同担任程序委员会主席;中国SDP联盟总体组副组长、复旦大学计算机科学技术学院教授汪卫,于明扬,中国SDP联盟总体组副组长、浪潮集团人工智能和高性能产品部研发经理、博士吴韶华共同担任组委会主席。
开幕式上,赵一鸣和郝晋新先后致欢迎辞。郝晋新表示,SKA是现代人类探索宇宙的最宏大的构想之一,SKA数据不仅是天文领域的数据,也属于全社会。“天眼”和“悟空”作为我国重大科技创新被写入党的十九大报告,体现了天文学在当代社会生活中的重要性,受到了全社会的广泛关注。SKA作为一项国际合作重大装置建设项目,它的建设周期长达十年,这对于中国SDP联盟的可持续发展既是考验也是机遇。科学大数据的处理涉及到广泛的学术领域,SDP工作包由国内多家单位联合组成。他对中国SDP联盟的工作表示肯定,自2013年组建至今,中国SDP联盟逐渐对天文用户需求有更加深入的理解。通过参与SKA建设,中国SDP联盟将在国际SKA的工作中发挥核心作用,展现中国制造和高性能计算的实力。他强调,基于中国SDP联盟的大数据、人工智能和高性能计算优势,应率先与南非建立合作;中国SDP联盟不应受制于当前国际SDP联盟,应提出自己的系统解决方案;鉴于SDP工作包的特殊性,在SKA综合论证过程中,中国SDP联盟应把SDP工作设想直接提交给中国SKA办公室。
会上,彭勃回忆了SKA的发展历程,对SDP队伍的不断壮大表示喜悦。他强调,中国SDP联盟要集中智慧,共同担当,为SKA的发展作出贡献。李菂简要介绍了FAST工程的建设和运营情况、工作原理、科学目标和计算挑战。他强调,在脉冲星搜索方面欢迎SKA中国科学数据处理联盟的合作。为了提高FAST工程的观测数据处理效率、提高科学产出的准确性,急需人工智能技术和高性能计算技术的引入。崔辰州指出,虚拟天文台能更好地融合全世界的天文学资源,这也对现有的计算带来了巨大挑战。秦波研究员介绍了SKA的建设进度,并对在国际合作过程中可能遇到的一些障碍进行了说明。中国SDP联盟总体组组长、SKA中国专家委员会委员、上海交通大学计算机科学与工程系副系主任、教授骆源代表中国SDP联盟,介绍了联盟的组成情况、2017年联盟参加国际SDP和SKA的活动情况和它的工作情况。他指出,目前中国SDP联盟承担了包括基于FPGA、MIC和GPU的SKA关键算法加速,基于COTS(商用平台)的SKA大数据执行框架研发,以及基于大数据处理平台的智能脉冲星搜索系统等任务。下一阶段,中国SDP联盟将在“神威•太湖之光”实现SKA科学数据处理验证平台。张云泉介绍了中国高性能计算的发展趋势、2017中国HPC TOP100的榜单和济南超算中心的项目应用情况,涉及海洋环境,生物医药,航空航天,军工,政务民生等领域。他预测,2018年将出现峰值1000TPflops的机器。刘鑫介绍了“神威•太湖之光”系统半机以上超大规模并行应用的算法特点、体系结构适应性、计算复杂度、访存复杂度和通信复杂度,并基于大规模实验分析结果提出E级复杂应用对未来E级计算机系统的设计需求。于明扬介绍了比特大陆公司ASIC和高性能计算的设计经验。他指出,基于这些经验,新的TPU处理器BM1680内置了CNN/DNN等深度学习加速算法,支持浮点科学计算与FFT等,可拓展到科学计算,将为SKA科学数据处理提供一个定制的系统解决方案。
会议期间,中国SKA科学数据联盟的成员针对各自的研发进展进行专题报告,围绕SKA的科学任务以及计算挑战展开讨论。池明旻介绍了基于人工智能算法和高性能计算在大数据平台上设计实现的脉冲星自动检测系统,部分功能已经在“神威•太湖之光”上得到验证。该工作的科学目标是SKA的主要科学目标之一,也是中方SKA定义的2+1科学任务之一。陈学雷介绍了和SKA相类似的天籁阵列及其对应的各种巡天实验和采集的大量的数据,目前已经完成了全天区较高质量的天图。中国科学院上海天文台研究员郭泉代替SKA中国科学数据处理联盟总体组副组长、中国科学院上海天文台研究员安涛介绍了中国SKA区域中心的准备和进展情况。
SKA天文大数据计算需要和国际SDP联合体的相关合作单位展开合作研究,目前主要聚焦在大数据计算平台和在这之上关键算法的实现两部分。针对此,汪卫介绍了与英国剑桥大学卡文迪许实验室合作的SKA-Spark研究进展情况;中国SDP联盟总体组副组长、广州大学教授王锋介绍澳大利亚西澳大学ICRAR主导研发的Daliuge框架及其合作研究进展;祝永新从硬件异构加速出发,介绍了其团队研发的基于Spark大数据平台和异构加速部件的多节点可扩展异构加速平台以及面向E级计算场景下的扩展原型设计部署。
在关键算法方面,国际SDP联盟推出了SKA成像管线的算法参考库ARL。针对此,中国SDP联盟总体组副组长、中国科学院计算技术研究所研究员尤海航介绍了ARL库性能不佳的原因,并对其核心和耗时的算法进行了整体优化,保持对天文用户应用的透明。中国科学院计算技术研究所博士贾海鹏提出了CPU+GPU集群上实现3D FFT的算法。解放军信息工程大学赵亚群教授介绍了该团队对ARL性能优化的工作。吴韶华介绍了浪潮集团对耗时约占SKA成像一半以上的Gridding、deGridding、deConvolution三种算法在MIC平台上的优化结构,并宣布了可免费供中国SDP联盟使用的32个节点的KNM集群。
本届中国SKA科学数据处理学术年会加强了天文、大数据、高性能计算、人工智能等交叉领域的深入沟通。预计在中国SDP联盟联合多方力量的共同努力下,将不断取得更大收获,为SKA工作作出更多贡献。