英伟达举办GTC 2022大会:大力倡导AI,正式推出琥珀GPU

今天英伟达举办了GTC图形技术大会,在本次大会上,英伟达大力介绍了在AI领域所取得的重大成就,并且还推出了大量的为AI运算保驾护航的图形处理器,其中就包括全新一代的琥珀GPU,比如说H100这款旗舰机GPU产品,英伟达也介绍了基于H100 GPU所打造的各种超级计算机与AI计算系统,同时也介绍了英伟达借助AI在医疗、自动驾驶、机器人、模拟仿真领域所取得的成就,不过在这次GTC图形技术大会上,英伟达并没有公布关于游戏显卡的消息。

今天英伟达举办了GTC图形技术大会,在本次大会上,英伟达大力介绍了在AI领域所取得的重大成就,并且还推出了大量的为AI运算保驾护航的图形处理器,其中就包括全新一代的琥珀GPU,比如说H100这款旗舰机GPU产品,英伟达也介绍了基于H100 GPU所打造的各种超级计算机与AI计算系统,同时也介绍了英伟达借助AI在医疗、自动驾驶、机器人、模拟仿真领域所取得的成就,不过在这次GTC图形技术大会上,英伟达并没有公布关于游戏显卡的消息。

QQ截图20220322230204_副本.jpg

QQ截图20220322232813_副本.jpg

首先当然是专业用户比较关注的琥珀GPU,在经过相当长一段时间的传闻之后,英伟达这一次终于官宣了这款旗舰级的GPU,命名也跟之前一样,为Hopper架构,核心代号为H100。首先是制造工艺,与之前传闻的有所不同,H100采用的是台积电4nm制程工艺,不过英伟达将其称之为4N,应该是4nm定制版,同时基于CoWoS 2.5D晶圆级封装,拥有超过800亿个晶体管,英伟达表示这是目前性能最为强大的GPU。此外英伟达也公布了关于H100的具体参数。

QQ截图20220322233319_副本.jpgQQ截图20220322233329_副本.jpg

H100计算卡共有两种不同的规格,包括面向PCIe 5.0以及SXM5两种传输通道,其中H100 SXM5的规格最大,拥有132个SM单元,62个TPCs,其中负责单精度运算的SM单元共有128个,而负责AI计算的Tensor Core共有4个,也就是15872个FP32计算单元,与528个深度学习单元。搭载80GB的HBM 3显存,提供3TB/s的显存带宽。不过据挖掘的信息,实际上H100并非琥珀架构的完整版,完整版应该拥有144组SM单元,共计18432颗处理器。基于NVLink 4.0打造的传输系统可以让传输带宽达到900GB/s,是PCIe 5.0的7倍,对外带宽更是可以达到4.9TB/s。

QQ截图20220322233600_副本.jpg

至于具体的性能,H100拥有60TFLOPs的单精度性能,2000TFLOPs的半精度性能,1000TFLOPS的TF32性能,而与AI深度学习栖息相关的INT8性能,可以达到4000TFLOPs,如果说这个数据还不够直观的话,那么与A100相比,H100处理器的单精度、半精度与TF32性能提升了3倍,INT8精度提升了6倍,可谓十分地恐怖。而如此强大的性能带来的结果就是更高的功耗,每张卡达到了700W的功耗,而上代则是400W。

QQ截图20220322234005_副本.jpg

QQ截图20220322233523_副本.jpg

QQ截图20220322234050_副本.jpg

英伟达H100计算卡只是组成超算的一小部分,这一次英伟达还推出了DGX H100系统,拥有八颗H100,同时配备了支持PCIe 5.0处理器,这套系统能够拥有最高6400亿个晶体管,最高640GB的显存,以及24TB/s的显存带宽。而在算力上,DGX H100系统拥有32PFLOPs的AI算力,1.6P的FP16算力,同样是上代系统的数倍。甚至DGX H100也只是更大超算的一小部分,英伟达还介绍了DGX POD,基于最新的NVLink Switch技术让最多32个节点的DGX H100互联,形成256颗H100芯片的计算单元,最高可以实现1EFLOPs的AI算力,也就是100亿亿亿次。数字也已经超过了大家的想象。除此之外,英伟达也发布了ConnectX-7网络互连芯片,拥有800亿个晶体管,支持400G的信息吞吐量以及加密计算,应该是为高性能计算机的互联互通起到作用。

QQ截图20220322234338_副本.jpg

除了性能爆炸的H100计算卡之外,英伟达也公布了关于自研CPU的更多信息,比如说Grace,实际上它是由CPU以及GPU合成而来,采用Grace架构CPU以及琥珀架构GPU,单个处理器拥有72个核心,可以说达到了ARM架构处理器的巅峰水准。除此之外,英伟达还介绍了Grace CPU Superchip系统,基于两颗Grace打造而来,最高拥有144颗核心,带宽达到了1TB/s,在SPECint 2017测试中,跑分为740分,目前是没有对手的存在,不知道英特尔和AMD是怎么想的。此外英伟达也推出了NVLink-C2C技术,这是因为目前的PCIe 5.0已经不能满足高性能处理器之间的传输需求,能够实现900GB/s的传输带宽,能效是PCIe 5.0的25倍,此外NVLink-C2C并不排斥英特尔和AMD的CPU产品。

QQ截图20220323001347_副本.jpg

除了上述这些性能强大的计算单元之外,英伟达也介绍了自家的AI在工业设计、医疗领域、自动驾驶、大气模拟等领域所取得的成就,还推出了Hyperion 9自动驾驶套件,拥有14个摄像头、9个雷达,3个激光雷达以及20个超声传感器,将让自动驾驶更加智能,这套系统于2026年开始出货,同时英伟达也和比亚迪合作,明年上半年推出的新车将会采用英伟达的Orin处理器。

QQ截图20220323003925_副本.jpg

可以说这一次英伟达是将自家产品强大的AI性能淋漓尽致地展示在消费者以及行业的面前,展示其极其出色的图形处理与计算能力,借助H100处理器,下半年的Ada游戏GPU在性能上应该有比较大的提升,不过能耗的大幅提升似乎也将成为定局。大家还是早点准备大功率的电源吧。

(本文仅代表作者观点,不代表百略网立场。)
评论
最新评论
暂无评论