众所周知,在当前的智能手机市场中,“AI”早已成为各大手机厂商频繁提及的宣传重点。
一方面,各头部手机品牌如今无不宣称拥有“自研AI大模型”,并通过形形色色的“性能优化方案”,在手机上实现了主打影像、辅助日常生活、或是提升游戏体验的“AI功能”。
另一方面,纵观上游芯片厂商,他们在宣传新款SoC时,如今也普遍聚焦于NPU架构的改进、能效比的提升,以及联合各类AI大模型进行的端侧性能优化演示。
但回顾前些年的智能手机宣传,我们会发现一个有趣的现象:在“手机AI”尚未普及的年代,厂商们推广早期“NPU”时,都会明确给出性能(算力)指标。虽然那时NPU能实现的功能相当有限,但消费者至少能一眼看出不同品牌、不同代次SoC之间NPU性能的差异与进步幅度。
相比之下,如今的手机SoC性能已大幅提升,NPU也更加先进,能够支持更多“端侧AI”功能。然而,各大厂商在宣传时却普遍只进行具体的“功能演示”。无论是手机厂商还是上游芯片厂商,似乎都对“NPU算力数字”这个直观参数——它本可以让普通消费者轻松对比优劣——闭口不谈了。
那么,这背后的原因究竟是什么呢?
基于常识,当某个数据突然不再公布时,往往意味着它的表现可能不尽如人意。
对于手机NPU而言,这一逻辑似乎同样成立。以高通为例,2019年的骁龙855首次公开宣传NPU算力,数值为7TOPs。之后的骁龙865、骁龙888、骁龙8 Gen1也均公布了这一数据,分别为15TOPs、26TOPs、52TOPs。
然而自骁龙8 Gen1之后,高通便不再公开NPU的“算力数字”。根据公开技术资料,2024年发布的骁龙8至尊版NPU算力为80TOPs,而今年刚换代的第五代骁龙8至尊版则达到100TOPs。
发现什么问题了吗?尽管高通这两代旗舰SoC的NPU性能在行业中依然“遥遥领先”,但这也意味着从骁龙8 Gen2到骁龙8 Gen3的两代产品中,NPU“算力数字”的进步速度确实有所放缓。
从这份统计数据中可以看出,高通的NPU性能领先幅度依然显著
当然,这只是高通一家的状况。根据我们三易生活掌握的数据,其他主流手机芯片厂商在“NPU算力数字”方面,可能面临更尴尬的局面。因此,当高通率先不再公开宣传NPU算力时,其他“友商”自然也有了“从善如流”的理由。
从相关数据中可以观察到,早期几代手机SoC中的NPU几乎每次换代都实现“算力翻倍”。但到了最近两年,NPU的“算力”进步速度明显放缓。
一个容易想到的原因是,早期的NPU在设计上留有更多“余量”,因此能够实现代代翻倍。但随着半导体制程成本不断攀升,加上厂商需要将更多功耗分配给新架构的CPU和GPU,这种“翻倍”设计自然难以维系。
但如果我们回顾彼时的市场宣传,会发现厂商在停止宣传NPU“算力数字”后,每次芯片换代时依然会宣称新的NPU比前代“性能翻倍”。
如今大家已经明白,单从“硬件算力”来看,NPU远未达到每次更新都翻倍的地步。那么“性能翻倍”又从何说起?简单来说,这是因为“手机AI”的内涵——即所处理的任务类型——已经发生了巨大变化,从而对NPU的设计需求也截然不同了。
举例来说,早期的“手机AI”几乎都集中在“计算视觉”领域,如用摄像头进行面部识别、拍照时的自动场景优化,甚至播放视频时的自动画面增强。这些技术需要NPU具备强大的图像信号吞吐量,因此最早的NPU几乎完全专注于纯粹的“峰值算力”,追求在最短时间内完成计算。由于其他时间NPU很少参与手机日常工作,能效比稍差也无妨。
但如今情况已截然不同。手机的“AI功能”不再局限于计算视觉,而是更多地集中在“内容生成”方面,例如AI生文、AI生画,甚至拍照时用AI“生成”缺失的细节。加之AI功能日益丰富,系统日常调用NPU的场合愈发频繁,这就要求现在的NPU一方面在底层架构上针对生成式AI任务做出调整,另一方面必须比过去更注重长时间运行时的能效比。
打个比方,近期一些机型已开始用NPU协助GPU进行游戏中的“超帧超分”处理。如果NPU仍沿用过去那种“爆发式”性能设计,显然无法满足需求。
当然,在针对新的AI应用需求调整底层设计后,如今各家芯片厂商的NPU“硬件性能”实际上在最近两年已重新回到增长轨道。只是由于各种限制,如今的手机NPU已无法像过去那样每一代硬件算力都直接“翻番”。
难道以后完全无法“指望”手机NPU再有大幅性能提升吗?
从现有信息来看,倒也不至于,但肯定不会像以前那样单纯靠“堆规模”和提升频率来解决问题。例如,部分手机厂商会通过将私有算法“固化”进NPU,相当于用算法直接定制硬件,从而提升NPU在执行特定任务时的计算效率。
对于更多品牌而言,与大模型进行技术合作,深度调校AI功能在NPU上的兼容性和执行速度,也是当下提升NPU性能的主要方式。例如,就在最近,三星与Nota AI达成合作,希望通过软件优化让Exynos 2500的NPU(算力59TOPs)在实际AI执行速度上“追平”第五代骁龙8至尊版上的那颗100TOPs算力NPU。
虽然我们对于这样的“优化”能否真正实现持保留态度,但它至少表明,对于如今手机SoC中的NPU设计来说,软件优化所能实现的效果,甚至可能比单纯的硬件设计更为重要。
本文由主机测评网于2026-02-24发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260226887.html