2015 年 10 月,美光(Micron)对外称,将要在未来一段时间内给市场带来一种经过改进后的 GDDR5 显示记忆体——GDDR5X。不过并没有透露更多细节,而且当时连美光自己都不确定这项技术是否具有可行性。
美光之前预计在 2016 年年底开始量产 GDDR5X 显示记忆体,能否成功投入商用就得看 AMD、NVIDIA 是否採用。不过日前,JEDEC 已正式认可并公布了 GDDR5X 的显示记忆体技术规範,这能够显着增加该技术的吸引力。
GDDR5X vs. GDDR5
HBM 显示记忆体已经成为新一代高阶显示卡的标準之一,而且之前 JEDEC 也正式公布了 JESD235A 的技术规範标準,带来了 TB/s 级频宽、16 / 32GB 超大容量的 HBM2 显示记忆体。不过 HBM 的问题在于成本依然很高,不可能短时间内应用在全部显示卡上。
而另一方面,虽然全新的 GDDR6 早已开始投入研发,但是因为技术、市场各方面的原因,也无法在短时间内投入商用。
GDDR5X 则可以简单理解为在 GDDR5 技术基础上的一个延伸,毕竟 GDDR5 已经在显示卡上用了将近 7 年,技术已经相对成熟。如果能够像 HBM 那样大幅提高显示记忆体频宽的话,理论上性能也能够得到进一步提升。
于是,GDDR5X 选择採用双管齐下的方式来提升显示记忆体频宽。首先,它的汇流排从 DDR(双倍数据倍率)升级到了 QDR(4 倍数据倍率)。
▲ SDR、DDR 和 QDR 之间的资料传输速率差异。需要说明的是,SDR(单倍数据倍率)即只利用时脉信号的上沿来传输资料;而 DDR(双倍数据倍率)则同时利用了时脉信号的上沿和下沿来传输资料,这意味着系统可以在同样的时间内、同一 clock 频率下将传输资料的速率提升一倍;而 QDR(4 倍数据倍率)则在 DDR 的基础上,进一步提供独立的写入介面和读取介面,以此达到 4 倍之于 SDR 的资料传输速率。
同时,GDDR5X 还简单的将资料预取位元宽从 8-Bit 提升到 16-Bit,从而得到更高的频宽,初期即可达到 10-12Gbps,而随着进一步的研发最高能够提升到 16Gbps。相比之下,GDDR5 现在最高也才 7Gbps。
传输速率的提升再加上显示记忆体位宽的提升,相当于在提高车速的基础上又拓宽了车道数量。
外媒 MonitorInsider 从 GDDR5X 的技术标準层面上剖析了它与 GDDR5 的不同之处,他们在文中提到,使用 GDDR5X 显示记忆体技术时可能无法完美适用于 Nvidia 的 GPU。
因为 16-Bit 资料预取位元宽意味着每次预取都将包含有 64 位元组的资料,而 Nvidia 的 GPU 所使用的是 32-Bit 标準,所以每当 N 卡访问 L2 快取记忆体时,DRAM 都将获取到两倍之于 L2 快取记忆体中的资料量。
不过为了保持与 GDDR5 的相容性,方便厂商升级,GDDR5X 显示记忆体引入了一项名为"伪独立记忆体读取"(Pseudo independent Memory Accesses)的新技术,这应该能够帮助解决这一问题。
GDDR5X 并没有解决 GDDR5 的核心缺陷
既然 JEDEC 已经正式公布了 GDDR5X 的技术标準,那么 AMD 和 Nvidia 很有可能在未来应用这项技术。鑒于 HBM 和 HBM2 在量产上的技术难度,以及有别于平面结构的 3D TSV 立体硅穿孔技术,导致产业内很多人士都认为实际上 GDDR5X 是更佳的长期选择。
平心而论,RDRAM、Larrabee 和安腾处理器都过于超前了,因为目前来说这些技术仍不成熟,相对而言成本过于昂贵。而事实也证明,这些超前的新技术分别被改进多次之后的 DDR 记忆体、光栅和 AMD 的 x86-64 所替代。
但为什么 HBM 却得到一个不同的结局呢?
原因就在于,HBM 和 HBM2 的改进不仅停留在提高记忆体频宽上,这两个技术标準都大幅削减了 VRAM 功耗,还显着提高了显示记忆体性能。此外,HBM2 所提供的 VRAM 密度是 GDDR5X 所无法比拟的。
(图片来源:Samsung)举个例子,就在 1 月 19 日,三星宣布基于 HBM2 技术的产业首个 4GB DRAM 显示记忆体颗粒,已经开始批量生产,4GB HBM2 封装下面是缓冲晶片,上面是 4 个 8Gb(1GB)容量的 HBM2 DRAM 晶片。
不仅如此,三星还计划今年推出 8GB HBM2,容量在此基础上再翻一倍,一颗就能满足高阶显卡的需求,从而比 GDDR5 节省 95% 的电路板空间。
而反观当下的美光生产的 GDDR5 显示记忆体最高也只能达到单晶片 1Gb。即使假设美光能够在未来将其提升到 2Gb,也仍需 16 颗晶片才能追上三星,而且这 16 个晶片都需要各自独立的寻迹路由,物理上的面积需求也是一个大问题。虽然 GDDR5X 能够把讯号电压降低到 1.35v,但这仍不足以抵消晶片数量的增加所带来的整体功耗提升。
▲ 这张图片显示出在平面结构上无限叠加 RAM 所带来的问题:GDDR5X 下单个 32Gb 的 GPU 需要更多的晶片。在 2D 平面上进行颗粒叠加也存在技术瓶颈,而且还会进一步增加发热量和功耗,最终的研发和生产成本甚至并不亚于 HBM2。上面的这张幻灯片就是 AMD 在一次演讲中所述,它同样也适用于 Nvidia。
发力中阶市场,解燃眉之急
不过,至少在最近的一段时间内,我们或许能够看到一到两家供应商开始使用 GDDR5X 技术。这在短期内能够使 AMD 和 Nvidia 在 GPU 频宽 VRAM 缓冲大小上获得实质性的提升。
虽然 HBM2 、GDDR5X 和 GDDR5 到底谁主沉浮仍不明朗,但没有哪家公司会想要放弃 GDDR5X 带来的竞争优势。毕竟,搭载 GDDR5X 显示记忆体能够使得 Nvidia 或 AMD 在中阶显卡上的频宽问题得到有效缓解。