第一篇:走进科技期末大作业——现代科技成果一瞥超级计算机
沈阳理工大学 《走进科技》课程大作业
现代科技成果一瞥——超级计算机
专业:电子信息工程
姓名:王子豪 学号:110303042
3有着“现代科技大脑”之称的超级计算机,正日益成为各国争夺的一个战略制高点。在中国,超算发展迅速,2013年11月18日,国际 TOP500组织公布了全球超级计算机 500 强排行榜榜单,中国国防科学技术大学研制的“天河二号”再度登上榜首。
1.超级计算机就在我们身边
超级计算机离我们似乎很远,但实际上它已影响到日常生活中的方方面面,比如每天的天气预报、大型影视中的特技渲染等。超级计算机(Super computer)主要有两个“超级”之处:一是指计算能力超级强,现有的超级计算机运算速度大都达到每秒一兆(万亿)次以上;二是指它由“超级”多的计算机组合而成,联合工作,而非一台计算机。
科幻电影《黑客帝国》中的Matrix(母体)实际就是一台超级计算机,已拥有了超越人类的智慧,并进一步想要统治人类。其他如《终结者》中的“天网”也是一台超级计算机。现实版人机大战,比较著名的是IBM制作的超级计算机“深蓝”与国际象棋大师卡斯帕罗夫之战,共6局比赛,最终以卡氏俯首认输而告终。
当然,人类研究超级计算机不是为了玩,它与我们的日常生活越来越紧密相关,我们每天都要关注的天气预报,就是超级计算机在收集到的海量气象数据中进行运算得出的。在去年的春节联欢晚会上,《龙凤呈祥》节目吸引了众多观众的目光,美轮美奂的舞美效果更是艳惊全场,在节目舞台背景的大屏幕里圆形的龙体正在翻滚,四个柱子上的巨龙不断盘旋,舞台上代表中国的元素来回变换„„画面跟随音乐的律动时而大气磅礴,时而温柔妩媚。
可是这么漂亮的舞台背景是怎么生成的?它的幕后功臣就是超级计算机—天河一号。因为最初背景设计只是一个龙凤的轮廓,制作团队要把模型通过“天河一号超级渲染平台”制作成图片,我们最终在电视上看到的效果是由近60万张图片拼成的。一张图片如果用普通计算机渲染需要30~40分钟,60万张图片的渲染需要的时间就至少是180万分钟!这么大的渲染工作量就需要利用超级计算机来完成,工作人员使用“天河一号”制作只需几分钟时间!
2.超级计算机“超”在哪里
超级计算机的特点就是具有超级计算能力,超级计算机的制造也是为海量的计算服务的。那么它的超级计算能力是怎么获得的呢?首先从硬件方面进行解读。
2.1超级计算机的超级配置
衡量一台电脑硬件的好坏,我们经常会从CPU主频、内存容量进行比较。对于超级计算机来说,它的配置参数超乎想象!以下表为例:
表1 TOP500前十名HPC性能指标
普通电脑的CPU,即使是目前最强的Intel酷睿i74770K(主频3.5GHz),也只有四核心(八线程)的运算能力。天河二号仅仅服务器专用十二核心处理器就多达16000颗!
内存方面:1024TB内存。对普通人来说,1TB的硬盘已是海量了,它竟然有1024TB的内存。我们电脑中的所谓大容量8GB内存,与之相比真是沧海一粟。
天河二号的每个核心其实就类似一台高性能个人电脑,各个核心通过专用网络连接起来。因此天河二号的真身就是一组组类似于服务器的机柜。
超级计算机的超强计算能力实际上是网络中每台高性能服务器计算能力的叠加,所以说天河并不是一台计算机,它实际上是一组高性能服务器组成的网络系统。难怪天河的正式名称叫“天河高效能计算机系统”,它可是一个真正的计算系统。
2.2超级计算机的超级通讯能力
如上所述,从硬件方面来说超级计算机是多个计算节点组成的网络系统。网络大多使用拓扑结构组成,因此超级计算机最难解决的是内部通讯的瓶颈问题。因为网线的通讯速度是有上限的,这个上限在不同环境下是浮动的,比如说干扰小的时候通讯速度快,干扰大的时候速度就慢。每个节点计算出数据后,就要通过网线及时发送到其他相关节点,因此网络通讯的好坏直接影响超级计算机的计算能力。比如“天河二号”通过使用自主研发的处理器、网络、互联芯片解决了这一难题,从而实现了不可思议的硬件规模和傲视群雄的运算能力。节点之间达到双向160Gbps传输速度,也就是说一部20GB的电影文件在两个节点之间传输时间只要1秒(1Gbps的传输速度理论上是128MB/s)。正是这些高性能网络组件造就了超级计算机的超级计算能力
2.3超级计算机的“软超越”
由 于 超 级 计 算 机 使 用 了 多组C P U + G P U,简单地将这么多的CPU+GPU叠加起来并不能有效提高计算能力。因此超级计算机大多使用并行处理技术,它的操作系统可以为每个计算节点同时分配不同的子任务并最终汇总,从而实现高速计算。还是以上面的舞台背景照片处理来说,例子中的整个舞台背景总共需要渲染的照片多达60万张,对于传统PC来说,电脑的处理是按部就班从第1张一直到第60万张,所需的总时间=60万*每张照片渲染所花的时间。如果现在让拥有10001个计算节点的超级计算机来渲染,假设它的并行设计是每个节点渲染60张,节点1负责1到60张,节点2负责61到120张,依此类推,第10001个节点负责把其他节点相加的结果汇总再相加。这样使用超级计算机开始进行操作时,10000个计算节点就会同时开始渲染,所需的总时间=每个节点渲染60张照片的时间+第10001节点汇总所花的时间。可以比较一下,10001个节点的超级计算机的渲染能力几乎是普通PC的10000倍,它的计算速度自然比PC
快了很多。当然真正的超级计算机拥有的是数十万个计算节点,上述的比较也只是数字上的简单对比。
超级计算机不仅拥有高性能的CPU、动辄TB量级的内存和高效能阵列硬盘,而且采用优异的结构设计。比如天河就使用CPU+GPU异构计算,这种设计可以大幅提高电脑计算能力,这些因素的组合造就了超级计算机超乎寻常的计算能力。天河二号实测运算速度可以达到每秒3386万亿次。这意味着,它计算一天,相当于一台家用电脑计算800年。
3.超级计算机的现状及趋势
过去的30多年里,随着各国越来越多地意识到科学计算的重要性并将其提升到国家战略层面,世界各地纷纷建立的超级计算中心已经成为国家层面的重要基础设施之一。同时作为软环境建设与发展的重要支撑平台,超级计算中心也成为重要的依托载体,据分析总体而言超级计算中心可以分为以下三类:
1.面向国家及科研服务为主
2.面向商业运作为主
3.交叉性质的超级计算中心
在服务方面,随着超级计算用户群的壮大及应用水平的提高,用户对于超级计算的需求变得越来越专业化,国内外超级计算中心的用户服务管理也逐步向着更深层次和更多样化发展。例如,美国橡树岭国家实验室计算科学中心的科学计算组直接参与用户的科研活动甚至直接加入用户的科研团队,为用户实施移植开发和调优等工作。而且,各大型超级计算中心的服务人员的职位竞争也非常激烈,同时中心还以用户组的形式组织用户通过用户选举产生的执行委员组织会议与计算中心进行沟通,执行委员会还有专门成员参与一年一度的计算资源分配。
4.超级计算机的发展及挑战
4.1能耗与应用的挑战
高性能计算机采用GPU/accelerator的方式将成为未来一大趋势。同时,由于技术所限,目前的高性能计算机在基础建设方面广泛存在规模过大、功耗过高、可靠性较低等问题。业界人士表示,高性能计算机中的能耗问题是一个越来越严重的问题。对于天河二号这样的大机器来说,每年少则 4000~5000 万的能耗费用是不可避免的。天河二号现在最大的挑战是应用。由于“天河二号”刚刚完成部署,应用还未铺开。考虑到应用一直是中国高性能计算机的短板,所以未来天河二号的应用将被广泛关注。
与天河二号同时登上 TOP500 前 10 位的来自亚洲的超算机还有日本的 K 计算机。日本的超级计算机有一个特点,就是在硬件诞生的同时,就有庞大的软件开发计划。如在K-computer的应用方面,日本政府投入了大量的资金,集中在几个主要方面:生物、生命科学、纳米科学、环境、气侯科学、制造业、基础教育等。在每一个方面,日本政府每年投入 2~3 千万美元来支持应用,而且在日本的工业界,很多大公司都积极投身到K-computer的应用当中,比如在汽车工业方面,很多大公司竞相宣布,要使用K-computer 来促进汽车设计和使用测试。而天河二号能否在应用方面树立一个榜样,既有速度、又有应用值得拭目以待。
4.2生态或有变
此外,在高性能计算机领域,生态正在悄然发生改变。谷歌正在试图推出自己的服务器芯片,传闻谷歌在自己的数据中心一直用一些低成本的机器自己搭建服务器,现在他们终于开始向服务器芯片领域进军了。只需要投资数千万美元,谷歌就有机会对工作负载进行彻底优化、从而帮助自身提升服务运行速度或者降低服务交付所带来的运营成本。对于谷歌来说,真的问题绝不是“是否”、而是“何时”自产服务器芯片,虽然有可能谷歌的芯片真正面世需要 3~5 年。但这对市场来说,绝对是个大消息。另一个值得关注的新闻是,IBM 和英伟达的合作。其采用的策略也是将 CPU 和 GPU 融合在一起,这正是AMD 在做的事情,这种联合将对Intel 的战略部署产生很大的影响。毕竟,CPU 与 GPU 的融合被广泛地认为是未来的趋势。那么,Intel将如何面对正在变化的生态环境值得一看。
综合这几个消息来看,未来高性能计算市场的生态将会发生重大改变,而为了应对这种潜在的危机和IT 界无法避免的不安全感,最近1~2 年内各大公司应该都会有一些新的战略性的改变。