王嘉兴/中国青年报
除了呼呼的风扇声,赛场一片寂静,在场的上百名大先生紧盯着电脑,手指飞快地敲击键盘。
这群均匀年龄不到22岁的大先生,面对的是当下最前沿的研讨:机器阅读了解、获2017年诺贝尔化学奖的冷冻电镜技术、美国国度航空航天局(NASA)的流膂力学模仿软件……
面对海量的数据,清华大学的大四先生李北辰预算后决议调整方案,“简直没法跑完”。临到完毕,他甚至能听到本人的心脏“咚咚”地跳动。
这是2018年世界大先生超级计算机竞赛(简称ASC18)的现场,在2天20小时的规则工夫里,每个队伍需求本人搭建小型超级计算机,完成组委会布置的4道标题,运算的后果将作为最初成果的评分根据。
李北辰队伍搭建的机器的运算才能,约为1万台如今市面上主流家用电脑运算才能之和,但相比目前世界上最快的超级计算机“神威·太湖之光”,他们的算力还不到百分之一。
在几个国度超级计算中心的超级计算机里,日夜运转着全国各地发来的运算指令。不论是地理观测、航空模仿计算,还是天气预告、生物医疗等日常生活的需求,都需求超级计算机的支撑。
“超级计算机的研讨程度决议了一个国度的尖端科研实力。以天气预告为例,假如计算今天天气的工夫超越一天,那这个预告就毫有意义了。”国度超级计算济南中心主任张云泉通知中国青年报·中青在线记者。目前中、美、日、俄等国对高功能超级计算机研讨鼎力投入的面前,也是抢占科研制高点的竞赛。
1前面17个0
这是一个以万亿为计量单位的世界。
在超级计算机范畴,有着一份世界500强榜单。依据最新的排名,假如一台机器的运算才能达不到500万亿次每秒,它将被无情地“除名”。权衡超级计算机的规范“复杂粗犷”:运算才能够快。上一代超级计算机运用的架构与目前主流的不同,如今的技术未来也能够被量子计算机取代。
这份榜单每隔半年更新一次,总是能惹起全世界的关注,人们津津有味冠军的更替,哪个国度上榜的超级计算机最多、总算力最高还被美国总统写进国情咨文。
2013年至今,中国自主研发的超级计算机就不断稳坐榜首。最近两年,这个地位属于“神威·太湖之光”,它的峰值运算速度到达每秒12.5亿亿次,“1”前面17个“0”,大致相当于200万台普通电脑同时运转。
但它远不止是堆积用于运算的地方处置器(CPU)和图形处置器(GPU)这么复杂。张云泉通知记者,超级计算机的运算速度不遵照“1+1=2”的公式,还得思索它们之间任务分配、数据传输的损耗。“这就像指导10团体和指导1000团体的区别,假如不能合理管理,每团体的任务效率都会大大降低,即每个CPU和GPU的功能都没有失掉充沛运用。”
在国度超级计算济南中心,“神威·蓝光”超级计算机黑色的机箱严密排布,围成一个大圈,被小心安放在数百平方米的一楼大厅内。当这台研发费用数亿元的机器运转时,功耗是1兆瓦,大致相当于1.5万户家庭的家电功率总和,每年仅电费一项收入就接近2000万元人简单来说,创业有四步:一创意、二技术、三产品、四市场。对于停留在‘创意’阶段的团队,你们的难点不在于找钱,而在于找人。”结合自身微软背景及创业经验。民币。
相比国度超级计算中心的“大手笔”,李北辰参与的ACS18则要求机器总功耗在3000瓦以内,这意味着能运用的CPU、GPU数量有一个下限。
为了最大化应用它们的运算才能,他们必需一丝不苟,一方面细心分配每个节点的运算内容,另一方面还要简化复杂的运算,让每个节点能同时计算尽能够多的内容。
在这次竞赛中,他们队伍用了16块GPU,总价值超越60万元人民币。为了分摊风险,几位队员一人担任几块,小心翼翼地将这些宝贝从学校的实验室运到竞赛现场。赛前,场地上趴满了选手,大家都在紧张地装置和调试设备。
租用超算一天,破费上万元
竞赛开端不多久,参赛的选手就开端冒汗。除了心思要素,还由于现场设备高速运转时,会释缩小量的热量,队员戏称“可以摊鸡蛋了”。每个GPU都必需装备降温风扇,否则就会因温渡过高而中止运转。
对超级计算机来说,如何无效地带走这些“大脑”考虑时分发的热量一度是开展瓶颈。在国度超级计算广州中心,工程师专门建造了冷水厂,不连续运送8摄氏度的水进入“天河二号”的水冷零碎。
机房还布置人员24小时值班,监控机器的运转情况,清算渣滓进程,完成效率的最大化。“是机器就有损坏和出成绩的概率,怎样让它们的影响尽能够小也是门学问。”张云泉说。
李北辰曾参与另一场大先生超算竞赛,48小时不连续地竞赛,他和队员只能轮番睡觉,保证有人时辰盯着机器运转。此外,组委会还随机对赛场断电,考察顺序及时备份的才能。在实践运用中,这些都是极能够呈现的应战。
中山大学肿瘤防治中心的博士后赵齐对此深有领会,他所在的团队是最早用“天河二号”测试生物使用的团队之一。由于需求处置少量的生物基因组数据,他们从2012年起就开端运用超级计算机。
他通知中国青年报·中青在线记者,他曾遇到各种奇异的报错和义务丧失,环境配置也不定时出成绩,常常算出他本人都不敢置信的后果。
这是由于生物信息范畴在超级计算机上的使用还在起步阶段,成熟的软件不多,很多时分需求用户和超算中心的任务人员协作开发处理成绩。
在过来5年,光他一团体就用“天河二号”处置了超越100TB的数据。超级计算机能在几天或几小时里,处置普通计算机半年乃至几年才干处置完的任务。以前,等候运算后果是他最苦闷的时分,“用上超级计算机算是奔小康了。”
由于需求处置的数据太多,网络传输较慢,赵齐有时会采用邮寄硬盘的方式,“邮递员最快”。
只是这样的代价很高。赵齐所在的实验室每年耗费在数据存储上的钱就在5万元左右。租用超级计算机停止数据处置,有时一天就会破费上万元。
对少数用户来说,运用超级计算机和本人的电脑没什么区别,登录账号,上传数据就行了,运算远在千里之外停止。
超算世界500强前两名是中国
当你拿起智能手机,向语音助手讯问天气,远在美国的超级计算机在不到1秒的工夫里了解了你的意思。甜美的女声播报的后果,则由济南、广州、无锡等多地的超级计算机共同计算得出。
少量影视公司应用它停止前期特效处置,传统制造业也倚仗这个技术,局部公司洗衣液的瓶子都是超级计算机设计的。
有了超级计算机,研讨者可以模仿出人类器官对药物的反响,大大延长新药的研发工夫,节省本钱。在抗埃博拉病毒药物的挑选中,超级计算机可以在一天内完成超越4000万分子化合物的挑选,以最快的速度应对迸发性恶性传染病。
此外,运用超级计算机停止核爆炸模仿还是美国研讨核武器的方式。
过来,超级计算机的次要义务是停止迷信计算。最近几年,有关人工智能的运算恳求也越来越多。
为此,ASC竞赛也开端引入人工智能的成绩,李北辰打比如说,过来他们的任务相似于计算式子的后果,但如今,他们更像是在做使用题,要先读懂成绩,从中笼统出式子,再停止计算。
目前,“天河二号”的用户曾经超越1200家,包括各大高校、研讨所,支撑国度级课题超越400项。
2001年时,超级计算机500强名单中没有一台来自中国。而如今,榜单前两名都被中国占据。此外,中国的上榜数量到达204,排名第二的美国只要143。
2015年,美国开端对中国超级计算机范畴实施芯片禁运,在那以前,美国对中国出口超级计算机也有诸多限制,例如出售的机器功能不能高于中国本人所能研发的机器功能。
张云泉通知记者,我国曾经掌握超级计算机的制造技术,包括“神威·太湖之光”“神威·蓝光”的一系列设备,从芯片、操作零碎到冷却零碎都完全由我国自主研发。
虽然中国在硬件条件上获得抢先位置,但软件方面仍需求少量的投入。目前使用于超级计算机的商用软件简直全部由美国、日本等国开发,中国的市场占有率根本为零。
“使用于超算的生物信息学软件开发起来寸步难行。”赵齐慨叹,“人才缺口很大。”他所在的专业,很多人都保持运用“天河二号”,由于学习和沟通本钱太高。他觉得,超算中心应该做更多对超算技术的科普和培训。
在计算机迷信范畴,超级计算机不是抢手方向。李北辰的同窗中,每年只要10%左右的同窗对这个方向有兴味,少数人还是投身人工智能的研讨。
在张云泉看来,处理软件成绩需求政策和财政两方面的支持。“东方国度在超算范畴多是制定10-20年的方案,面前有点军备竞赛的意思。但中国不断是制定5年方案,完成后再讨论下一个5年要不要持续。这样规划不够久远,技术团队也难以坚持波动。”
他引见,我国对超级计算机范畴研讨的总投入与美国接近,但对软件的投入偏低,目前仅占总投入的20%。他以为,这个比例应该到50%比拟适宜,美国、日本也是这个比例。
“美国对超级计算机的研讨曾经超越了50年,而我国才刚刚30年,我们需求多一些耐烦。”张云泉说,“过来我们是跟在他人前面跑,就只顾得上追了。如今我们超前了,该看清行进的方向,这比追逐花功夫得多。”