近年来,生成式人工智能技术的飞速进步,推动全球范围内超大规模人工智能集群的部署步伐显著加快。随着摩尔定律逐渐失效,唯有依靠并行计算方能实现性能的持续提升,这导致数据处理与传输能力的增强必然伴随着能耗的攀升。换言之,人工智能基础设施的快速扩张正引发严峻的能耗挑战。如图1所示,数据量的指数级增长要求能源供应量也呈指数级增长。从这个角度来看,破解能源困局的根本出路在于研发一种能够使能耗增长与数据增长脱钩的创新技术。
光子学展现出巨大的应用前景,因为光波的传播与干涉过程本身不消耗能量,通过精巧的工程设计即可实现功能扩展而无需增加额外能耗。硅光子学经过二十余年的持续发展,如今已趋近理想平台,能够充分释放其内在潜力。具体而言,硅光子学可提供高效的高密度互连,支持高带宽与长距离传输;实现低能耗的光路切换,且不受信号带宽制约;以及构建光速计算的光子神经网络,从而大幅加速人工智能计算。
本文将回顾这些光子技术的最新发展趋势与突破,并论证为使它们成为人工智能时代可持续基础设施的核心组成部分,硬件与软件、电子学与光子学需要协同发展,互为补充。
A. 能耗扩展趋势
图2展示了光收发器与超大规模数据中心常用的电交换机专用集成电路(ASIC)的能效(单位:pJ/bit)随时间演变的趋势。对比可见,交换机ASIC的能效可扩展性劣于光收发器,表明系统瓶颈在于交换机而非收发器。令人瞩目的是,光收发器的能效提升已跟上摩尔定律的步伐,基于硅光子学的近封装/共封装光学器件的能效已突破5 pJ/bit,而交换机ASIC的能效改进则明显滞后。
实际上,ASIC交换机的功耗随吞吐量增加而急剧上升,在100Tbps吞吐量下,单芯片功耗可超过1000W;相比之下,光交换机的功耗极低,且几乎不随吞吐量增长而增加(图3)。因此,系统中光交换机替代电交换机的比例越高,整体能效就越优。下文将探讨一些实际应用问题。
B. 光交换机系统应用实例
光交换机的主要局限在于无法执行数据包处理,而这正是ASIC交换机的核心功能。光交换机仅作为“光路交换机(OCS)”运行,因此不能简单取代ASIC交换机。要控制OCS,必须构建控制平面,编排器或操作系统需实时掌握OCS状态,并根据系统需求通过控制平面下发指令。这种模式与依赖ASIC交换机的传统分组系统截然不同,因而采用OCS需要从零开始重构整个系统,并对架构进行全面优化。显然,目前全球仅有谷歌具备这一能力。在谷歌宣布其数据中心和人工智能基础设施中大规模部署OCS之后,光交换机才获得广泛关注。
早在谷歌推出OCS系统之前,日本产业技术综合研究所(AIST)就已着手研发大规模硅光子交换机。图4展示了AIST开发的硅光子交换机刀片,该设备提供32×32严格无阻塞连接,配备数字控制接口,通过构建9级Clos网络可扩展至131,072×131,072个连接。实验表明,在可组合的解耦基础设施中,这些交换机能使网络功耗降低75%。
用于制造这些大规模硅光子开关的制造设备是日本产业技术综合研究所(AIST)基于标准CMOS技术的内部试验生产线,该技术采用45纳米工艺规则,实现了足够高的均匀性和良率,可以大规模生产包含数千个器件(例如马赫-曾德尔干涉仪(MZI: Mach-Zehnder interferometers))的大规模光子集成电路。
基于标准CMOS制造技术的硅光子器件具有高均匀性和高良率,这对于实现光子神经网络(PNN:photonic neural networks )至关重要。在PNN中,集成了大量的马赫-曾德尔干涉仪(MZI),形成网状拓扑结构,并在光域中执行矩阵-向量乘法(MVM:matrix-vector multiplications)。PNN上的MVM过程本身速度极快,且不消耗能量,可以显著提升人工智能(AI)的计算能力。因此,人们期望PNN能够分担GPU等高能耗数字处理器的计算任务。然而,PNN缺乏良好的非线性激活函数,而非线性激活函数是AI计算中另一个重要的功能。
为了解决这个问题,我们提出利用电光(EO:electro-optic)非线性效应,仅通过传播即可完成AI计算过程,而无需中间阶段的数字处理。利用马赫-曾德尔干涉仪(MZI)器件可以轻松实现这一点,该器件以电信号作为输入,以调制后的光信号作为输出。电光非线性具有正弦传递函数,这与传统的激活函数(例如 ReLU、Sigmoid 和双曲正切函数)截然不同。因此,需要寻找适用于概率神经网络(PNN)的全新人工智能模型。
A. 基于光电非线性的概率神经网络
目前,我们已提出并演示了几个基于光电非线性的AI模型,如下所示:第一个模型包含一个从输入参数空间到更高维空间的非线性投影映射。通过调整马赫-曾德尔干涉仪(MZI)的工作点来训练其光电传递函数。转换后的光学复空间中的非线性映射数据可以通过寻找超平面进行分离,类似于支持向量机。
图5(a)和5(b)分别展示了我们开发的硅光子芯片和实验装置。我们使用BFO(bacteria foraging optimization)和前向差分两种算法在芯片上进行了训练,并在图5(c)中展示了它们对多个布尔逻辑进行分类的有效性,并在图5(d)中展示了它们对鸢尾花数据集的高精度分类。该PNN仅通过无源光子电路中信号的物理传播即可完成计算,从而保证了低功耗和低延迟计算。
我们在此讨论的第二个模型是上述模型的级联版本,即“垂直分层光电概率神经网络”(,如图 6 所示)。在该模型中,所有光路的长度不会随着层数的增加而增加,从而能够实现更深度学习模型。
图 7 显示了 MNIST、Fashion 和 KMNIST 数据集的测试准确率。三层模型的准确率优于两层模型。我们在此介绍的最后一个(但同样重要)模型是光电霍普菲尔德网络。
图 8(a) 显示了我们提出的架构,其中马赫-曾德尔干涉仪 (MZI) 作为非线性神经元,将输入数据和反馈信号编码到输入的单频连续波 (CW) 光(记为 λ)上。图 8(b) 显示,经过训练后,即使对于半损坏的输入模式,也能回忆起存储的模式,这表明了霍普菲尔德网络特有的联想记忆效应。
B. 流式 PNN 的通用方案
由于运行 PNN 需要不可忽略的开销,因此必须对整个系统进行彻底评估和整体优化。另一方面,PNN 的固有优势是低延迟、高速度、低能耗等。为了充分发挥这些优势,PNN 作为流式处理器,同时具备电域和光域 I/O 时,运行效果最佳。流式 PNN 的概念如图 9 所示。通过该方案,PNN 可以同时在电域和光域中流式处理数据,从而无缝集成到数字基础设施中。
硅光子技术取得了显著进步,如今在诸多方面展现出巨大的潜力,能够从高密度I/O、带宽无关的电路开关以及光速AI加速器等多个方面提升人工智能基础设施的可持续性。然而,将光子功能器件(例如OCS和PNN)引入传统数字基础设施并非易事,因此,未来需要对整体系统设计和实现进行更深入的研究。
本文由主机测评网于2026-03-15发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260331501.html