今年3月份的GTC大会上,NVIDIA正式发布了新一代加速显卡H100,台积电4nm工艺,集成800亿晶体管,最高1.8万个CUDA核心,功耗高达700W,80GB HBM3显存。H100计算卡有SXM、PCIe 5.0两种样式,PCIe版价格都要24万元以上,SXM版会更贵一些,实际价格还不太确定。
不过花了这么多钱购买H100显卡也不亏,因为它的性能提升相比上代实在是太大了,最近MLPerf Inference 2.1中透露了H100显卡的性能,这也是第三方基准平台首次公布H100的AI性能,如下所示:
测试分为两个类型的,测试的项目也主要是考察各种AI加速,我们看个结果就行了,对比上代的A100显卡,H100在不同测试中性能是前者的1.5倍到4.5倍,多花点钱并不亏。
值得一提的是,这个测试中还公布了国内的壁仞科技公司前不久发布的BR100系列加速卡的性能,不过测试的不是满血版的BR100,而是BR104,性能只有BR100的一半。
在这个测试中,BR104的表现也不错,只不过测试项目不全面,无法得出准确评估结果,而且BR104的性能相比BR100减半,无法再现壁仞PPT中BR100吊打NVIDIA加速卡的场面。