英伟达AI芯片H200性能提升60%-90%，开始供货

更新时间：2024-03-28 18:13:04作者：gdhst

3 月 28 日消息，据日本经济新闻今日报道，英伟达的尖端图像处理半导体（GPU）H200 现已开始供货。H20 为面向 AI 领域的半导体，性能超过当前主打的 H100。

根据英伟达方面公布的性能评测结果，以 Meta 公司旗下大语言模型 Llama 2 处理速度为例，H2000 相比于 H100，生成式 AI 导出答案的处理速度最高提高了 45％。

市场调研机构 Omdia 曾表示，2022 年英伟达在 AI 半导体市场约占 8 成的份额，与此同时 AMD 等竞争对手也在开发对抗英伟达的产品，竞争愈演愈烈。

英伟达当地时间 3 月 18 日在开发者大会上宣布，年内将推出新一代 AI 半导体“B200”，B200 和 CPU（中央运算处理装置）组合的新产品用于最新的 LLM 上。“最强 AI 加速卡”GB200 包含了两个 B200 Blackwell GPU 和一个基于 Arm 的 Grace CPU ，推理大语言模型性能比 H100 提升 30 倍，成本和能耗降至 25 分之一。

GB200 采用新一代 AI 图形处理器架构 Blackwell，黄仁勋在 GTC 大会上表示：“Hopper 固然已经非常出色了，但我们需要更强大的 GPU”。

据此前报道，英伟达 H200 于去年 11 月发布，其为基于英伟达的“Hopper”架构的 HGX H200 GPU，是 H100 GPU 的继任者，也是该公司第一款使用 HBM3e 内存的芯片，这种内存速度更快，容量更大，因此更适合大型语言模型。较前任霸主 H100，H200 的性能直接提升了 60% 到 90%。英伟达称：“借助 HBM3e，英伟达 H200 以每秒 4.8 TB 的速度提供 141GB 的内存，与 A100 相比，容量几乎是其两倍，带宽增加了 2.4 倍。”