AMD Instinct™ MI100加速器以领先业界的运算效能为HPC与AI带来颠覆性改变
首款採用全新AMD CDNA架构的GPU加速器为exascale等级时代量身擘划
AMD(NASDAQ: AMD)发表全新AMD Instinct™ MI100加速器,为全球最快高效能运算(HPC)GPU,同时也是首款突破10 teraflops (FP64)效能的x86伺服器GPU注1。MI100加速器获得戴尔、技嘉、HPE、美超微(Supermicro)等各大厂商的新款加速运算平台支援,结合AMD EPYC™ CPU以及ROCm™ 4.0开放软体平台,旨在为即将到来的exascale等级时代推动全新发现。
AMD Instinct MI100 GPU採用全新AMD CDNA架构打造,搭配AMD第2代EPYC处理器,为高效能运算与AI开创出全新等级的加速系统。MI100在高效能运算方面提供高达11.5 TFLOPS的FP64尖峰效能,在AI与机器学习工作负载方面则提供高达46.1 TFLOPS的FP32 Matrix尖峰效能注2。透过全新AMD Matrix Core技术,MI100在执行AI训练工作负载时能提供比AMD前一代加速器提升近7倍的FP16理论尖峰浮点运算效能注3。
AMD资料中心GPU与加速处理部门全球副总裁Brad McCredie表示,AMD推出AMD Instinct MI100,为全球最快的高效能运算GPU,代表着我们往exascale等级运算的目标迈进一大步。瞄準科学运算中最关键的工作负载,最新加速器搭配AMD ROCm开放软体平台,两强合併的组合为科学家与研究人员提供更为优越的高效能运算工作基础。
瞄準Exascale等级时代所打造的开放软体平台
AMD ROCm开发者软体为exascale等级运算提供基础。ROCm作为一个由编译器、程式开发API与函式库组成的开源工具集,可以帮助众多exascale等级软体开发者打造高效能应用程式。经过优化的ROCm 4.0能为基于MI100的系统提供大规模运算的效能。ROCm 4.0已将编译器升级至支援开源并统一支援OpenMP® 5.0与HIP。此外,PyTorch与Tensorflow框架都已针对ROCm 4.0进行优化,能配合MI100达到更高的效能注7、8。ROCm 4.0是为高效能运算、机器学习以及人工智慧程式开发者量身打造的最新方案,让他们开发高效能的可移植软体。
橡树岭国家实验室领导运算中心科学总监Bronson Messer表示,我们已经率先使用MI100加速器,初步使用效果让人非常振奋。我们见证到大幅的效能提升,相比其他GPU高出达2到3倍。我们也同样意识到软体对效能影响的重要性。开源的ROCm开放软体平台以及HIP开发者工具能在各种平台上运行,这是我们自推出首款混合CPU/GPU系统以来最关切的特点。
AMD Instinct MI100加速器的关键功能与特色包括:
全新AMD CDNA架构-AMD CDNA架构提供卓越的效能与功耗效率,为AMD GPU提供exascale等级时代的效能,同时也是MI100加速器的核心。
为HPC工作负载提供领先的FP64与FP32效能-提供领先业界的5 TFLOPS尖峰FP64 效能,以及23.1 TFLOPS的尖峰FP32效能,帮助全球各地科学家与研究人员加快在生命科学、能源、金融、学术、政府、国防等领域的新发现注1。
为HPC与AI开发的全新Matrix Core技术-针对全範围单精度与混合精度矩阵运算提供大幅提升效能,其中包括FP32、FP16、bFloat16、Int8、以及Int4等,促进HPC与AI的融合。
第2代AMD Infinity Fabric™技术-Instinct MI100使用3个AMD Infinity Fabric™ Link时,可在PCIe® 4.0上提供约2倍的P2P (peer-to-peer)尖峰I/O频宽,以及每张显示卡高达340 GB/s的总频宽注4。在伺服器中,MI100 GPU可配备两个完全连结的Quad GPU单元(hives),每个单元可为高速资料分享提供高达552 GB/s的P2P I/O频宽注4。
超高速HBM2记忆体-配备32GB高频宽HBM2记忆体以及2 GHz的时脉频率,带来超高的1.23 TB/s记忆体频宽,支援庞大资料集,协助消弭资料在记忆体存取时的传输瓶颈注5。
支援业界最新PCIe® Gen 4.0技术-配合最新版PCIe Gen 4.0技术进行开发,在CPU与GPU之间提供高达64GB/s尖峰理论传输资料频宽注6。
伺服器解决方案案例
企业级市场的各大OEM与ODM合作伙伴厂商预计将于今年底问市的新系统中搭载AMD Instinct MI100加速器,其中包括:
戴尔
戴尔科技集团PowerEdge伺服器资深副总裁Ravi Pendekanti表示,Dell EMC PowerEdge伺服器将支援全新AMD Instinct MI100,能更快从数据中分析出洞察。这将协助客户迅速得到更强大且高效率的HPC与AI结果。AMD一直是协助我们推动资料中心创新的重要合作伙伴。AMD Instinct加速器的高效能特性与PowerEdge伺服器AI与HPC产品阵容完美契合。
技嘉
技嘉NCBU助理副总裁Alan Chen表示,我们很高兴再次与AMD合作成为策略伙伴,为客户提供高效能运算所需的伺服器硬体。AMD Instinct MI100加速器代表着资料中心高效能运算的全新水平,为能源研究、分子动力学、以及深度学习训练带来更高的连接性与资料频宽。作为技嘉产品阵容的全新加速器,我们的客户将在一系列科学与工业HPC工作负载上获得更好的效能。
HPE
HPE全球副总裁暨高效能运算部门总经理Bill Mannel表示,客户运用HPE Apollo系统带来的特定功能与效能,解决在高效能运算、深度学习以及分析等领域中一系列複杂的资料密集型工作负载。随着全新HPE Apollo 6500 Gen10 Plus系统的推出,我们进一步推升产品阵容,并藉由支援全新AMD Instinct MI100加速器与AMD第2代EPYC™处理器来改进工作负载效能,发挥更高的连接性与资料处理能力。我们期盼继续与AMD合作,利用其最新的CPU与加速器来扩大我们的产品方案。
美超微(Supermicro)
美超微现场应用工程与事业发展部资深副总裁Vik Malyala表示,我们非常高兴AMD Instinct MI100加速器为高效能运算领域带来巨大影响。全新CDNA架构带来的运算力提升,加上MI100带来的高记忆体容量以及GPU P2P传输频宽,我们的客户将可获得各种卓越的解决方案,满足其加速运算需求以及关键企业工作负载。AMD Instinct MI100将为我们多重GPU伺服器以及高效能系统与模组化构建式伺服器解决方案的广泛产品阵容提供一个卓越的扩充方案。