辉达(NVIDIA)地表最强 AI 晶片 GB200 横空出世,由 2 颗 B200 与 Grace CPU 晶片封装而成,并在 1 颗 B200 晶片功耗高达 1,000 瓦至 1,200 瓦的状况,首度採用水冷散热技术,成为市场关注焦点,外资出具最新报告拆解 NVIDIA GH/GB200 超级晶片供应链。
外资表示,辉达 GB200 明年占 70%、GH200 占 30%,其中 GB200 分为 NVL36 及 NVL72,并预计将以 NVL36 为主,而 NVL36 的机柜(rack)约 150~200 万美元,至于 NVL72 则为 1.8x(不到 2x)。
散热方面,外资表示,每个 GPU 为 300 美元,较市场预估的 2000 美元少,而市场传 GB200 散热为 4~8 万美元,每个元件至少有 4 家供应商,预估价格理应不会太高,但 CSP(云端服务供应商)没有一定要个别採买零件,或是一定要完整解决方案,因此个个有机会,但个个没把握。
进入百家争鸣抢市的局面,外资表示,辉达 CPU 为自行推的 Grace,属于 ARM 架构,CSP 想用 ASIC 或 x86 架构,但从 GTC 大会推出后,CSP 客户给予正面回应,从 CP 值来看,每花 1 美元得到的算力更好,而且辉达也会提供 x86 架购产品。
CoWoS 目前仍是以台积电为主,外资表示,但今年也会新增 amkor(艾克尔)及 intel(英特尔)供应链,合计与台积电将各占一半,明年辉达目标 600~650 万颗,其中用 GB200 则占 70%,算起来 5.8-11.7 万个机柜,今年约 400~450 万颗。
GB200 组装方面,外资表示,鸿海最大、纬创为 tier1,至于广达则算 tier2,而且鸿海积极争取 GB200 机柜,但 CSP 不会放弃 ASIC,而且时间拖越久,效能未能急剧跳耀,数量就会越来越少,预估今年训练模型的 GPU,就会转为推理模型,使得 ASIC 数量可能就没办法上来。
外资强调,ASIC 目前就是看 Amazon、Google,其他的业绩表现都很差,而信骅近期提到通用伺服器订单陆续恢复,公司预期 CSP 客户可能降低前一世代的 AI 伺服器採购,等待 GB200 出货,因此先将今年预算用在通用伺服器採购,代表 H100 既有 ODM 及 ASIC AI 供应链有下修风险。
(首图来源:NVIDIA)