,虽然仍然是采用CDNA 3架构,但是相较于AMD Instinct MI300X GPU还是有一些明显的提升,且官方多个方面数据显示,该芯片多项性能优于
不过,对于AMD一系列的产品发布,市场方面似乎并不买账,AMD股价出现了一波明显跳水。可以发现,无论是市场面还是需求方,似乎还是对英伟达Blackwell GPU有更大的期待,虽然这款芯片此前曝出了良率缺陷问题。
由于同样是CDNA 3架构,因此MI325X和MI300X在计算性能方面基本是一致的,使用先进的2.5D封装,芯片内部有1530亿个晶体管,304个计算单元,AI算力(采用半精度浮点数FP16衡量)最高可达到1.3PFLOPS,也与MI300X相同。
虽然和自家芯片对比提升并不是太明显,但根据AMD的官方数据,AMD Instinct MI325X GPU是强于英伟达H200芯片的。官方文件显示,与H200相比,具有参数优势的MI325可提供1.3倍的峰值理论FP16(16位浮点数)和FP8计算性能。AMD公司CEO苏姿丰表示,“你们能看到的是,MI325在运行Llama 3.1时,能提供比英伟达H200高出多达40%的性能。”根据发布会的信息数据显示,在模型推理方面,无论是单卡还是多卡,AMD Instinct MI325X GPU相较于英伟达H200基本有20%-40%的性能领先;在模型训练方面,AMD Instinct MI325X GPU也有单卡10%的性能领先。AMD预期,Instinct MI325X GPU芯片将从四季度开始生产,并将在明年一季度通过合作的服务器生产商供货。
同时,苏姿丰预测AI芯片后续美好的未来,数据加速器的市场将在2028年增长至5000亿美元,而这一个数字在2023年时为450亿美元。在更早之前,苏姿丰曾预测全球数据中心人工智能加速器市场规模将在2027年达到4000亿美元。无论是哪一项数据预测,都足以显示目前全球AI发展高涨的情绪。
不过,即便新产品有着不错的性能,且未来市场空间广阔,但是AMD Instinct MI325X GPU的发布似乎并未达到市场的预期,和自家上一款芯片Instinct MI300X GPU的性能差距并不明显,也没有能够借助这次发布会进一步缩小和英伟达之间的差距。因此,市场快速反应,AMD股价有了一个明显的下调。
市场还是倾向于选择英伟达当然,消息面上也有不利于AMD本次新品发布的,那就是摩根士丹利发布了一份关于英伟达最新Blackwell GPU架构的报告,并透露导致造成生产瓶颈的补充信息。
此前,有新闻媒体报道称,Blackwell架构产品生产上出现了一些问题,导致较低的良品率,进而影响了出货。英伟达在一份声明中表示,对Blackwell架构GPU的掩膜进行了改动,以提高产量。英伟达Blackwell GPU是第一批采用台积电CoWoS-L封装的产品,其使用RDL中间层与LSI桥接器连接小芯片,可实现约10Tb/s的数据传输速率。
与以往的CoWoS-S和CoWoS-R技术相比,CoWoS-L在性能和灵活性方面都有显著提升。这种技术利用LSI桥接器实现高密度的互联,能够兼容各种高性能芯片,如先进逻辑、SoIC(系统集成芯片)及HBM(高带宽内存)。挑战在于,由于GPU芯片、RDL中间层、LSI桥接器以及基板之间的热膨胀系数(CTE)不匹配,因此存在一定的生产挑战。
摩根士丹利指出,英伟达Blackwell GPU生产良率下降在后封装阶段发现的,这导致了良率的降低,并使原本供应紧张的CoWoS封装和HBM3e内存的情况雪上加霜。但该机构觉得,这样一些问题在英伟达内部都已逝去了。摩根士丹利在报告中写道,“目前 Blackwell 产量提升‘相当强劲’,不会对原定路线图造成影响,所有迹象说明业务依然稳健,前景很清晰,这与我们的所有调查一致。”
摩根士丹利预计,英伟达将于今年第4季度将出货最多45万张Blackwell GPU,以此来实现50亿美元到100亿美元的营收。同时,该机构觉得,当前安排不了的Blackwell GPU订单,在大多数情况下要到明年下半年才能够安排,因此前期订单已经签满了1年,而这些不足以满足的订单,将促进Hopper GPU的需求。
原本英伟达Blackwell GPU的生产问题被认为是AMD公司的机会,但现在来看这个机会并没有正真获得兑现。一方面,英伟达很快就解决了这个困扰Blackwell GPU良率的问题;另一方面,AMD Instinct MI325X GPU作为相同架构升级的产品,性能提升只是体现在带宽上,这虽然可提升集群的效率,但市场方面认为还不够,无法给英伟达造成更大的冲击。
另外,AMD并未提及能耗的优势,这也是英伟达宣传Blackwell GPU的一个重点。该公司副总裁兼企业平台总经理Bob Pette在“AI SummitDC”人工智能峰会期间表示,Blackwell平台绝大多数都是考虑到能效而构建的,在Blackwell上开发OpenAI的GPT-4软件需要3吉瓦(gigawatts)的电力,而十年前,这一过程需要高达5500吉瓦电力。
另外还有CUDA生态的问题,AMD公司也意识到了这一点,此前该公司将把面向消费者的RDNA和面向数据中心的CDNA架构统一为一种新的微架构UDNA。在2024年国际消费电子展(IFA 2024)上,AMD高级副总裁兼计算与图形事业部总经理Jack Huynh宣布了这一架构,代表了AMD在GPU领域的一次重要革新,但是要挑战英伟达的CUDA生态,还有非常长的路要走。因此,AMD UDNA是一项长远的布局,也需要更加多的时间兑现其潜力。
结语实际上,在AMD Instinct MI325X GPU发布之前,市场面上慢慢的开始为其造势了,AMD作为目前英伟达GPU头号挑战者,因此人们自然而然要去关注这款旗舰GPU。不过,作为同是CDNA 3架构下的产品,AMD Instinct MI325X GPU并未达到市场设定的性能基准线。不过正如苏姿丰所言,数据中心加速器市场是非常庞大的,英伟达一家吃不下,那么外溢的订单就会流落到AMD等公司的手里,这个时间段AMD可以更沉下心来打磨应用和生态。