粤超级计算机冲击E级算力,布局迈向多个分中心 发力超算新高度 驱动世界级创新
来源:未知 发布日期:2020-11-30 查看:42,这是科幻电影《银河系漫游指南》中,超级计算机对宇宙奥秘给出的最终答案。
打破科幻与现实界限的,是通过超级计算机解答“天问”的信念和实践。
“计算是生产力、影响力、竞争力,计算驱动一切。”在“天河二号”机房外面,国家超级计算广州中心主任卢宇彤这样说。
数字经济时代,超级计算机就是参与竞争的大国重器。南方日报记者走访发现,广东在这一领域正走在全国前列:不仅集聚了全国六大超算中心中的两个,各地超算分中心和企业、高等院校的超算建设也如火如荼。
与此同时,关键零部件和大型运算程序大多依赖进口,设备迭代升级压力大等,也成为广东超算的现实挑战。
日前发布的《广东省推进新型基础设施建设三年实施方案(2020—2022年)》也提出,支持国家超级计算广州中心、深圳中心升级改造,增强高性能计算能力和云平台能力的拓展应用,支持鹏城“云脑”、珠海横琴、东莞大科学等智能计算平台建设,打造世界领先的超级计算高地。
上天下海,科技创新“算”出来
穿过两道玻璃门,在机房特有的“嗡嗡”运行声中,九排百米长、两米多高的黑色机柜“天河二号”高速运转。通过3.2万颗主CPU和4.8万个协处理器,上到天文航天,下到大洋深海,都是它的用武之地。
日前,国产大飞机C919首次在航展上腾空而起,吸引全球目光。
在这背后,离不开“天河二号”:以2.4万个CPU核进行国产大型商用飞机全参数气动优化设计,6天完成以往2年工作量。“世界上航空航天飞行器的设计,70%以上都依赖超级计算机,比拼设计能力很大程度是比拼计算模拟能力。”卢宇彤说。
凭借10.07亿亿次的系统峰值运算速度,2013年到2015年,“天河二号”创下在世界超级计算机500强中连续六次夺冠的纪录。在今年11月发布的全球“超算”500强榜单中,“天河二号”排名世界第六位。
卢宇彤表示,国家超算广州中心(以下简称“广州中心”)自主研发了星光超算应用平台,搭建了面向大气、海洋、物理、生命科学、新材料等各领域的高效运行环境。这在今年的疫情防控中发挥了重要作用。
对没有特效药的未知病毒,“老药新用”最快也最安全,问题的关键在于时间。“以普通计算机的算力,从所有上市药物中筛选出有效药物,需要2—3个月。”广州智睿医药科技有限公司首席执行官谢伟东博士说,该公司在“天河二号”上进行药物虚拟筛选,只用两三天便迅速定位30余种潜在有效药物。
在“天河二号”科研人员加班开发的同时,位于深圳南山区的国家超算深圳中心(以下简称“深圳中心”)也是一片忙碌的景象。“可以腾出平台帮我们做药物筛选吗?”中山大学药学院副院长罗海彬教授焦急询问。深圳中心紧急调配运算资源,协助罗海彬一周内筛选出5种可用药物。
“疫情对城市的影响是多方面的。地铁停运、公交停运的影响有多大,封堵措施是否有漏洞,都需要超算进行模拟。”国家超级计算深圳中心主任冯圣中说。
目前,广州和深圳两个国家超算中心的应用领域还在不断拓展。
广东省环境监测中心的监控室大屏上,红、橙、黄、绿的色块在地图上不停变换——这代表当地空气污染情况由重到轻。
“与广州超算中心合作以来,我们不断优化空气质量模型参数,实现对广东、湖北、湖南、海南、广西、福建等华南六省区未来10天空气质量预测预报。”广东省环境监测中心陈多宏博士说。
沈劲是该中心的高级工程师、空气质量预报员。每天早上8时半,他都要通过空气质量预报系统,查看未来十天每小时的空气污染物预报数据。“高性能计算任务迁移至‘天河二号’后,经过调试,单个模型10天自动预报时间可以从9个小时缩短到约5个小时。”
“广州中心不仅要做一流的系统,也要做一流的应用。”卢宇彤说,该中心目前在“全球最具应用影响力超算中心”榜单上位列第五,也是目前我国唯一进入榜单的超算中心。
算力跃升千倍,布局走向多中心
近30年来,超级计算机的性能几乎以每10年提高1000倍的速率暴涨。
后来者始终有追赶机会,但也意味着稍不留神就落在后面。
深圳中心配置的国产曙光6000超级计算机系统,2010年5月实测运算速度达每秒1271万亿次,排名世界第二。然而,在全球超算全力冲刺每秒“百亿亿次的超级算力”(也就是建设E级超级计算机)的今天,已经落伍。
算力相对停滞,但超算的需求却与日剧增。
“十年前有四个需求——服务小企业、服务大企业、服务社会、服务科研;十年后的今天,科研的需求大大增长,服务基础科研,支撑关键性技术突破,发挥社会效益成为深圳超算的首要目标。”冯圣中说。
面对越来越旺盛和多样的超算服务需求,“算力”的供需瓶颈有望很快得到缓解:深圳中心二期选址深圳光明科学城,计划建成持续计算能力达每秒200亿亿次以上的超级计算机系统,比目前性能提升1000倍以上,再次全球领先。
配合二期建设,深圳中心启动了包括国产气象数值预报模式研发、基因测序精准医疗等在内的“十大应用场景工程”。“机器、基建、应用三方面工作同步推进,确保二期建成之日,就是应用成果涌现之时。”冯圣中说。
广州中心则将建设超算分中心作为重要的发展方向。
珠江入海口,南沙天后宫旁边的一栋白色建筑二楼的机房里,几台黑色机柜“嗡嗡”运转。这里是广州香港科技大学霍英东研究院,也是国家超算广州中心南沙分中心。机柜延伸出的光纤专线,北上连通广州中心,东接位于香港的港科大清水湾校区,将广州的超算服务与香港的科研创新紧紧连在一起。
专线建设前,数据传输速率限制了很多科研活动的开展。专注研究海洋动力模型的香港科技大学甘建平教授团队,不得不把硬盘通过邮寄的“笨办法”传给国家超算天津中心,完成一个计算任务,路上就要几天。如今通过专线,运算效率极大提高。
“与‘天河二号’之间的专线连接,改变了香港科研团队通过普通国际网络使用超算的状况。”广州香港科技大学霍英东研究院科研和合作办公室主任沈钟透露,自2016年6月试运行到2020年9月,这里累计为近200个港澳和海外团队提供超算服务。
如今,广州中心已经在中山、广州南沙、深圳前海等地成立了九家超算分中心。
更多超级计算机、大数据中心等项目正在广东各地快速发展:阿里巴巴广东大数据综合平台项目在河源签约,腾讯华南云计算基地落户清远,鹏城实验室等单位联合研制的“鹏城云脑II”在11月19日发布的新一期IO500榜单中位列总榜榜首……
推进国产化,硬件软件一个不能少
在广东,越来越多的企业在利用超算推动创新。
广州天河软件园,图普科技展示厅的大屏上,不同店铺的人、货、场多维度图像信息滚动更新。“我们通过智能识别,了解用户喜欢哪一类型的商品,在超算中心进行数据处理,作为提升服务的参考,更好满足消费者需求。”图普科技的市场部门负责人韦光说,搜集到的信息会在进行数据处理后立即删除,以确保个人信息安全。
随着企业规模的提升,部分龙头企业开始着手自建超算平台。“企业自建的超算平台与超算中心是互补关系,例如广汽的设计服务器与‘天河二号’的系统连接实现层级化运行,他们依托‘天河二号’发布了三款新品。”卢宇彤表示。
对这一点,韦光感触颇深:“图普自己搭建有超算平台,今年疫情期间,视频内容识别的需求爆发,超算中心的算力是我们系统运行最强大的支持,目前部分算力需求也是由‘天河二号’满足。”
无论谁来建,自主可控都是绕不过去的重要课题。深调研团队走访发现,推进国产化正被摆在更重要的位置。
卢宇彤透露,下一代的系统升级以国产生态为主,要用国产的软硬件支撑新一代的超算构建,“不仅要有计算能力的硬实力,更重要的要有系统软件生态和应用的软实力”。
这与陈多宏的想法不谋而合。“超算应在硬件选型、软件支撑、技术服务等方面紧密结合行业应用,而不是单纯追求计算速度。”陈多宏建议,可以借鉴云计算技术,进一步提高系统易用性、稳定性。
“一流的超算中心都有对整个行业产生重大影响的科研成果,这也正是我们持续努力的方向。”在冯圣中看来,超算中心的服务水平分为三个层次:计算资源或资源服务,深度技术支持的资源服务,以资源为基础的技术服务。世界领先的超算中心基本做到最后一个层次,聚集数百位细分领域的科学家研发创新。
广东也正在为此而努力。在广州中心,长期工作的团队有80多个人,其中专业研究人员占一半,依托中山大学,超算中心正在形成人才聚集的高地,新进入的人才六成都有海外背景。
随着人才的集聚,硬件的提升,软件的完善,广东的超算发展未来可期。
“超算中心在某种程度上代表了一个国家的综合竞争力。一方面,它是核心科技创新的基础设施;另一方面,超算本身是科技创新,尤其是信息技术创新的结果。”卢宇彤说,超算在未来粤港澳大湾区的国际科创中心建设中,一定会发挥基础、核心、关键性作用。
智库观察
提高算力就是提升生产力
数据日益成为现代经济的关键资源,数据的处理能力就成为衡量产业是否接入数字时代的重要指标。
随着信息技术面临摩尔定律失效,重大原始创新也面临瓶颈。如何促进生产要素更加高效地流动、对接和组合,成为提升生产力的重要途径,而这必须依赖超强的计算能力。
另一方面,随着科学边界的拓展,实验设备投入向着天文数字高歌猛进,通过大数据模拟代替实验室实验成为推进科研探索的重要途径。
事实上,万物互联的前提,正是万事万物实现数字化表达,也只有将现实物质和人类语言(需求)实现数字化,才能实现数据联通和计算,在确保信息安全和机制公平的条件下,实现社会生产力和人类社会文明程度的提升。
展望未来,谁掌握了最为海量的有效数据,拥有最为强大的数据处理能力,谁就掌握了发展先机。对于以国际科创中心为目标的粤港澳大湾区来说,建设先进算力集群,势在必行,也势在必得。