当前位置:首页 > 科技资讯 > 正文

HBF或成AI存储新宠:未来存储解决方案的变革

尽管三星的HBM4尚未通过英伟达验证,但上周五(9月19日),三星的12层HBM3E已通过英伟达测试认证,预示着其即将成为英伟达GPU的HBM供应商之一。

这一消息引起了广泛关注。AI的兴起不仅激发了人们对大模型和算力芯片的讨论,也极大推动了内存需求。近年来,HBM(高带宽内存)成为这波浪潮中的明星。没有它,英伟达A100、H200等AI芯片无法如此火爆,大模型也无法如此迅速迭代。

因此,HBM供不应求,几乎成了半导体行业的硬通货,也令HBM主要厂商SK海力士超越三星,成为全球最大存储芯片制造商。

HBF或成AI存储新宠:未来存储解决方案的变革 HBF HBM AI存储 高带宽闪存 第1张

然而,问题也随之而来。HBM虽速度飞快、带宽高、延迟低,但容量有限,成本居高不下。随着AI模型增大,对内存的需求愈发夸张,单靠HBM难以满足未来全球AI推理的庞大需求。特别是以DeepSeek为开端,MoE模型(专家混合模型)减小了对算力的要求,使得内存墙问题更加突出。

早前,被誉为“HBM之父”的韩国科学与技术研究院教授金正浩表示,未来决定内存行业胜负的将是HBF(High Bandwidth Flash,高带宽闪存)。

这并非空穴来风。作为HBM的最大玩家,SK海力士已与闪存领域的代表闪迪合作,公开宣布联合开发HBF技术,并推动行业标准化。但HBF究竟是何方神圣?当HBM不再够用,HBF能否成为下一个接力棒?

HBF或成AI存储新宠:未来存储解决方案的变革 HBF HBM AI存储 高带宽闪存 第2张

内存堆叠转向闪存堆叠:HBF如何实现?

在解释HBF之前,先了解HBM。HBM全称高带宽内存,是GPU专用的豪华内存。它的特点是将多层DRAM芯片堆叠在一起,通过超宽接口直接连接到GPU上,从而拓宽数据通道,提升传输速度。例如,英伟达H200搭载的HBM3e单卡内存带宽达4.8TB/s,比普通DDR内存快几十倍。

然而,HBM虽速度惊人,但容量有限。其容量通常只有几十GB,即便SK海力士即将量产的HBM4单壳最高也只能做到36GB(未来可达64GB),而大模型的参数动辄上千亿。更现实的问题是,HBM成本极高,良率低、产能有限,导致GPU价格高昂,成为AI行业的瓶颈。

在此背景下,HBF备受关注。简单来说,HBF就是将NAND闪存堆叠起来,采用类似HBM的封装方式,使其既能像内存一样高速读数据,又能像硬盘一样存储更多内容。其目标并非完全取代HBM,而是作为容量补位:

HBM承担最关键、延迟最敏感的工作,而HBF则用于存储超大模型的权重、KV Cache等耗容量的部分。

HBF或成AI存储新宠:未来存储解决方案的变革 HBF HBM AI存储 高带宽闪存 第3张

换句话说,HBM是短跑冠军,HBF是长途卡车,两者结合才能既快又大。这也是“HBM之父”看好HBF的核心理由。

金正浩教授在9月初的演讲中认为,内存行业未来的胜负将取决于HBF。他认为AI趋势已从算力中心转向内存为中心,算力的增长再快,如果数据无法存储、模型无法容纳,都将受限。

而HBF正好能弥补HBM的容量短板,让系统既保持高带宽,又能拥有更大的可用空间和更低的成本。

这番话并非个人看法。在8月举行的FMS未来存储峰会上,闪迪透露了近两年开发的HBF,并宣布与SK海力士推动HBF技术标准化。SK海力士的优势在于封装和堆叠工艺——这正是HBM成功的关键;闪迪则是NAND闪存领域的长期玩家,拥有独特的直键合工艺。

更关键的是,HBF在设计之初就针对AI推理的特点:读多写少、批量顺序访问。这使得NAND的“写入短板”不再是致命问题,而其高密度、低成本、稳定性则被发挥到极致。

HBF或成AI存储新宠:未来存储解决方案的变革 HBF HBM AI存储 高带宽闪存 第4张

因此,金正浩的判断、SK海力士的布局、闪迪的押注都在指向一个共同逻辑:AI的未来需要的不仅是更快的存储,还需要更大的存储池。而如果没有HBF,AI的发展迟早会撞上天花板。

HBF彻底改变AI存储:从数据中心到消费终端

HBF的落地并非遥不可及。按照闪迪和SK海力士的规划,2026年下半年将有首批HBF样品出现,预计2027年初会有搭载HBF的AI推理设备面世。这意味着它最快将在两年内走出实验室,成为真实硬件产品。

这些首批设备最可能是GPU厂商和服务器厂商率先尝试。以英伟达H200为例,它是全球首款使用业内最先进HBM3e显存的GPU。而HBF就像为GPU接上了“外挂油箱”,不仅能让更多模型一次性装进来,还能大幅减少从SSD调数据的延迟。

但HBF的意义不止于数据中心。在边缘设备和个人计算领域,它同样可能带来巨大改变。

今天我们看到AI PC、AI手机都强调设备端运行大模型,但现实是终端设备的内存远远不够支撑上百亿参数的模型。如果HBF能以小型化模组甚至与处理器一体封装的方式进入终端,就有机会让用户本地调用更大AI模型,带来更流畅语音助手、更聪明生产力工具甚至离线AI应用。

HBF或成AI存储新宠:未来存储解决方案的变革 HBF HBM AI存储 高带宽闪存 第5张

更重要的是,HBF的成本和功耗优势使其天然适合在终端场景扩展。对于笔记本电脑、智能手机甚至XR设备来说如何在有限空间和电池里提供更强AI能力?HBF给出了现实答案:

在云端它缓解GPU内存瓶颈让超大模型更高效;在终端它可能成为AI普及化关键一步。

写在最后

从HBM的爆发到HBF的登场我们看到的是同一个趋势:AI已将内存和存储推到舞台中央。没有HBM就没有今天算力繁荣;而如果没有更大、更便宜、更低功耗的存储介质AI的未来也可能被“卡脖子”。

我们期待的不是因为HBF要全面取代HBM而是因为它补上了一个关键缺口——容量。它让GPU不再像背着小油箱的跑车那样捉襟见肘也给未来AI PC、边缘计算带来想象空间。当速度与容量形成合力AI的运行方式很可能被彻底改写。

- HBF真能像HBM一样从技术概念变成行业标配吗?

- 在数据中心率先落地之后它能否顺利走向个人计算终端?

- 当存储不再是瓶颈时下一个掣肘AI的环节又会是什么?

这些问题的答案或许要等到2027年HBF首批设备面世后才能揭晓。但可以肯定的是定义AI的边界不只是算力还在于储存。而这场比赛才刚刚开始。