高性能计算机(HPC,High Performance Computer,又称超级计算机)是国之重器。从核爆炸模拟、油藏模拟,到极端天气预报等,高性能计算都守护着国家安全和安宁。因此,高性能计算也成为衡量国家之间综合实力的基准之一,被视为国家实力的象征。 2020 年以来,十四五和新基建驱动我国高性能计算中心建设进入高速增长期,多地地方政府和企事业单位都在积极建设和筹建高性能计算中心。
什么是高性能计算 (HPC)
高性能计算是指将多个计算节点组织起来,通过网络连接在一起,进行协同工作,组成一台性能更强大的计算机,通常指具有极快运算速度、极大存储容量、极高通信带宽的一类计算机。高性能计算能够让整个计算机集群为同一个任务工作,以更快的速度来解决一个复杂问题。一台高性能计算上往往执行一个任务(或者有限的几个任务)。全部的计算机资源都被倾注到同一个任务中。为了解决同一个问题,集群的不同计算机之间要有非常好的沟通能力。
HPC 的优势
由于处理大型数据集和运行高级应用程序的需求不断增长,HPC 在学术和企业领域受到广泛认可。随着高度可扩展的高性能处理器、大容量高速内存、存储和网络的出现,HPC 技术应用变得日渐普及。科学家和工程师可以在本地部署的基础设施上运行 HPC 工作负载,或利用不需要大量资本支出的云资源进行纵向和横向扩展。
HPC 组件
最高效的高性能计算系统组合高级 HPC 硬件和软件产品设计而成。通常,适用于 HPC 的硬件包括高性能 CPU、架构、内存、存储和网络组件,以及专门用于处理 HPC 工作负载的加速器。
图1:高性能计算节点互联示意图
HPC 平台软件、库、针对大数据和深度学习优化的框架以及其他软件工具可帮助您完善 HPC 集群设计并提高其效率。
高性能计算机是计算机和网络的结合。假设说互联网从外部将分立的计算机连接在一起,那么集群则是将网络内部化,让网络成为系统内部不同计算机的沟通桥梁。首先创造性发明集群的是有“高性能计算之父”之称的 Seymour Cray。在 1960 年代,可以进行高性能运算的仅仅是经过特别设计的、昂贵的大型机。这些大型机需要复杂的回路以实现高运算频率,所以其设计和生产周期都非常长。Seymour Cray 提出并行是提高计算机性能的有效方式。1964 年,Seymour Cray 研制的 CDC 6600 问世,他将多个普通的处理器连接起来,并使得这些处理器协同工作。政府和科研部门开始采购这样的新型的高性能计算机,以代替原有的大型机。高性能计算机为登月计划等大型科研项目做出了不可磨灭的贡献,开启了高性能计算技术和产业多年的持续发展与繁荣。
高性能计算近 60 年的演变路线可简单地分为 2 个阶段:Cray 时代和多计算机时代。
(1)Cray 时代。从 20 世纪 60—90 年代初期的 30 年被称为“Cray 时代”,以单一内存向量机的技术革新为主导,Cray 定义和引领了前 30 年的高性能计算市场。第一个30 年研制以“顶天”为主,仅服务于国家战略部门。
(2)多计算机时代。从 20 世纪 90年代迄今的后 30 年被称为“多计算机时代”,由于微处理器的出现,以及大量工业标准硬件的普及,以大规模互连多个通用乃至商用的计算部件的可扩展系统结构的技术创新主导了迄今为止的高性能计算发展。后 30 年的高性能计算机在满足国家战略应用对性能巅峰需求的同时,“立地”成为发展的主要目标,市场驱动、高性能计算应用普及成为第二阶段的显著特点。
图2:高性能计算近60年演变的2个阶段
高性能计算为什么重要
性能计算是计算机科学与工程的“皇冠”。高性能计算是计算机技术的源头之一。互联网产业依赖的数据中心的核心技术,诸如 Hadoop 等并行编程工具和 RDMA 等远程通信技术大多脱胎于此。因此,高性能计算机被视为计算机科学与工程的“皇冠”。各国均频繁从国家层面启动研制计划。在中国多次上榜全球高性能计算 TOP500 后,美国自2015 年起将多所中国高性能计算相关机构或企业列入实体清单,包括国防科大、无锡江南计算技术研究所、曙光、申威等。而我国高性能计算整体实力和美国相比仍然有较大差距。因此,发展自主可控的高性能计算至关重要。
图3:世界主要大国高性能计算机研制计划
图4:全球高性能计算机性能 TOP50 机器制造台数
高性能计算的技术壁垒
高性能计算的核心能力是 64 位双精度浮点运算能力。高性能计算是一种通用算力,其设计目标是提供完备、复杂的计算能力,在高精度计算能力更强。业界广泛用于衡量高性能计算性能的 Linpack 测试,测试的是高性能计算的“双精度浮点运算能力”,即 64位浮点数字的计算(FP64),这是一种高精度的数值计算。在以二进制所表示数字精度中,还有单精度(32 位,FP32)、半精度(16 位,FP16)以及整数类型(如 INT8、INT4)等。数字位数越高,意味着人们可以在更大范围内的数值内体现两个数值的变化,从而实现更精确计算。
高性能计算在底层芯片性能要求上高于普通的数据中心和智算中心。算力中心有多种,大致可分为数据中心、高性能计算中心、智算中心等,而它们都可以用云的形式来提供服务。以实现人工智能需求为例,推理、训练和模拟为 AI 的三类主要任务。在此维度上,芯片的应用上限由其底层构造所决定,即使采用软件优化也无法再提升。从芯片层面来看,如果底层芯片采用的是 CPU+专用 AI 芯片,那么其只能完成 AI 推理和训练任务,而无法完成模拟。因为 AI 芯片无法实现双精度浮点运算,双精度浮点运算大量涉及线性代数方程求解,而自然界的很多问题,包括科学问题、社会问题等,最后都可转化为线性代数方程求解问题。
图5:不同精度可执行任务对比
高性能计算的体系结构设计和软件同样重要。芯片是高性能计算的重要组成部分,但不是高性能计算技术的全部。高性能计算不是简单的 CPU 堆砌,体系结构设计、高速互联网络、并行文件系统、储存列阵等方面如果有所欠缺,即使堆再多的 CPU,高性能计算性能也无法提高。随着计算能力的增强、应用课题规模和复杂度的增加,高性能计算机对并行文件系统等性能要求越来越高。高性能计算的技术溢出效益非常明显。由于服务器可以平滑地采用高性能计算的互联技术、CPU 技术、操作系统技术和并行软件设计等技术,在高性能计算方面的积累能够自然地溢出到服务器产业。
高性能计算的应用场景?
高性能计算适用于需要并行运算的任务,应用场景持续拓展。高性能计算主要应用场景分为两类,一类是飞行器设计、核模拟实验、星云模拟、解密码等数值模拟场景,一类是大数据分析、统计和人工智能等数据分析场景。由于飞行器等工程设计中很多情况无法实测,只能进行计算模拟,因此美国对出口高性能计算十分谨慎。高性能计算应用正在从过去的高精尖向更广更宽的方向发展。随着高性能计算的发展,尤其是使用成本的不断下降,其应用领域也从具有国家战略意义的核武器研制、信息安全、石油勘探等科学计算领域向更广泛的国民经济主战场快速扩张,比如制药、基因测序、动漫渲染、数据挖掘、金融分析以及互联网服务等等。从 2021 年 11 月中国高性能计算机 TOP100中的行业应用领域 Linpack 性能份额来看,算力服务、高性能计算中心、人工智能、科学计算等领域是高性能计算的主要用户,互联网大数据特别是 AI 领域增长强劲。
图6:中国 TOP100 行业应用领域份额(2021.11)
本文标题:什么是高性能计算 (HPC)
本文链接://www.hsggzxc.com/faq1/258.html [版权声明]除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。