当前位置:首页 > 科技资讯 > 正文

AI半山腰:技术落地的冷静洞察与产业赋能

自ChatGPT震撼登场,至今已逾三载。

三年间,市场对AI的热情丝毫未褪,反而赌注日益加大。但在资本持续加持的喧哗背后,盲目的兴奋正被一种具体的焦虑所取代:这波AI浪潮的终极目标究竟在何方?何种落地姿态才是正确的?

当大多数人仍仰望AGI(通用人工智能)的巅峰,或迷失在对话框之际,未来式智能联合创始人兼COO邹阳提出了一个冷静而独特的见解。

“沿着大语言模型这条路径,很可能无法抵达AGI的顶峰。不过这并不重要,我也无需关心。关键在于,在半山腰的技术水平已足以改变世界。”

邹阳认为,半山腰的技术能力已具备全部产品落地并创造价值的潜力。AI的真正战场不在打造陪聊的聊天机器人,而在于潜入产业流程,成为企业中那80%重复、高频、规则与判断聚合的脑力劳动的“外接大脑”。

这种判断力,源于邹阳在AI行业多年的深耕体验。

AI半山腰:技术落地的冷静洞察与产业赋能 人工智能落地  AGI前景 智能体平台 产业知识化 第1张

邹阳堪称经历了AI从1.0迈向2.0的完整周期。从魅族AI实验室,到搜狗语音交互技术中心,再到阿里巴巴达摩院,他的职业轨迹几乎与行业演进同步。

在达摩院期间,他负责的智能语音语义产品线连续多年在国内AI云服务市场稳居第一,属于最早将技术推向大规模商用的先驱之一。

他目睹过人工智能被视作“云资源钩子”的时代,技术存在却难以真正应用;也亲身经历了模型能力跨越临界点的时刻——从“部分可用”到“可被依赖”。这段长期浸润产业一线的经历,使他对当下的AI浪潮有着迥异的理解。

正因如此,邹阳成为最早选择投身创业的那批人。

2023年6月,当AI Agent(智能体)概念尚处萌芽时,他与来自达摩院的老同事杨劲松共同创立了未来式智能。团队迅速推出了国内首个企业级智能体构建平台——“灵搭”,并毅然扎进电力、能源、制造等最“重”的行业场景中。

在他看来,与其焦虑技术何时登顶,不如先在半山腰实现那些艰难却正确的价值,在企业中规模落地。

以下是他的思考与实践。

大模型迭代,陷入“自证陷阱”模型

硅基君:GPT发布的时候,你还在达摩院,当时第一反应是什么?

邹阳:ChatGPT问世前,可谓AI 1.0时代,能规模化落地的事物寥寥无几。许多人工智能技术仅是充当云资源的“钩子”。你展示一下技术,客户觉得厉害,便购买了云服务,但AI技术本身在当时普惠性极低,投入与产出完全不成比例。

当时达摩院内部,对GPT3.5其实有所预期,2021年达摩院在云栖大会上发布了百亿参数大语言模型AliceMind,当时还是劲松发布的,我们的结论是这技术用于海外电商广告文案等高容忍度场景尚可,但也仅止于此。

GPT3.5发布后,我大概焦虑了一个月。打个比方,就像玩了60年的游戏正式版突然上线,新手村最后一道始终无法逾越的门敞开了。但一出村便发现,游戏世界可能全然改变,你不知该往何处去,甚至连刷新的怪物都是前所未见。

作为一名专业高手,焦虑源于需要对新时代的底层机制有通盘了解,必须清楚在这个世界里,什么能做,什么还不能做。

我一直想像卢娜的父亲(《哈利波特》中的角色)那样创办杂志,名称也叫《唱唱反调》。焦虑过后,我得出了几点判断:

第一,沿着大语言模型这条路很可能无法登顶AGI但这不重要,我也不关心。重要的是,在半山腰已足以改变世界。现阶段,全行业确实可借这半山腰的技术彻底重构,产生巨大的普世价值。

第二,这波技术革命的最大价值,短期内,我认为不在聊天框里,什么陪伴、心理、真人,toC的下班使用场景。并非技术达不到,而是缺乏代际差相关产品心智难以形成,且非常考验产品与技术的磨合,没有长期主义的匠人精神难以打造,还需硬件创新配合。

这波技术革命的最大价值,在于能将上班场景中80%“照章办事”的工作完全用新技术为一线打工者赋能,将他们从无聊工作中解放出来,去思考更有价值的事;对企业而言,日常的知识性工作也可像生产车间一样,构建一条知识加工流水线,完成高频、高重复度、高标准化的低智力密集型知识工作。

2023年3月我们开始组建团队创业,至今我们始终如此践行。

硅基君:从ChatGPT发布至今已三年,你对AGI的判断有变化吗?

邹阳:没有。

普通人拥有一件绝佳的思想自卫武器,叫做常识,确实需要以史为鉴、总结经验来不断升级它。

这一波真正跨越“奇点”的是GPT-4,而非GPT-3.5。

我认为,GPT-4真正完成了一次全人类级技术的革命性飞跃,后续想在短短几个月甚至几年内再次实现同量级的飞跃,几乎违背技术发展的常识。

回顾人类技术发展史,第三次科技革命至今已近百年,从2018年Transformer发布到现在,不过短短几年,曲线很难在一个里程碑后立刻再次陡直上升,至少需二十年。

从技术角度看,Transformer这条主干自2018年确立以来,行业更多是在同一框架内进行工程化优化和渐进式改良。如果底层范式没有新迭代,仅靠继续堆数据、堆算力,很难再复制一次类似GPT-4的再造“奇点”。

硅基君:这是基于历史经验的直觉,还是有判断依据?

邹阳:从个人体验看,近期一堆新模型发布,只要你去用,就会知道新模型相较上一代并未带来质变,对于提示词工程熟手而言,只是更省事罢了。

当然,基准测试上能看到一些提升,但我们做应用的更看重“真实场景中能否完成旧模型解决不了的任务”。至少在我们第一时间用它处理那些旧模型无法解决的问题时,结果并无质的改变

举个最直观的例子:分类。我们将业务规则尽量用提示词梳理清楚,做上下文工程,让模型进行一千多类客服业务反馈的细粒度分类。上一代模型准确率约70%–80%,新模型仅提高几个百分点,时效性、上下文长度、幻觉等问题依然存在,只是程度不同。

这就引出一个问题:从大厂宣传口径看,投入巨大、声量浩大,今天这个超越一切,明天那个又超越昨天。按理说能力应“肉眼可见”地跃迁,但落到应用侧只涨几个点,说明技术本身正进入明显的边际递减阶段——更新仍在继续,但很难再沿同一路线迈上大台阶。

因此,你会发现,行业大量工作变成“修修补补”:更好的对齐、更强的工具调用、更稳的输出、更低的成本。这些改进很重要,但它们更像工程化增量,很难单靠这种补丁式迭代再次引发结构性巨变。

这种投入状态,宛如感情中的自证陷阱:对方说“你不爱我了”,你便开始用无数细节证明“我爱你”。证明越多,反而越说明问题不在细节,而在于底层逻辑本身站不住脚

硅基君:那如何看待o1模型的成功?在许多人看来,它代表一种新的扩展范式?

邹阳:o1确实是一个里程碑,但我的观点是它更多源于机制创新。

它在模型内部自动生成思维链,以此提升推理效果。但模型本身的理解和推理能力上限,仍由基础模型决定。这好比给一个普通人更多时间思考,他确实能表现更好,但他并未变成天才

硅基君:当大量资本涌入AI行业,会否加速下一个奇点的到来?

邹阳:我更倾向于将“下一次AI范式突破”视为一类极少数问题:它属于那撮同时具备顶尖智力、方法论和研究自由度的人,而非靠更多资本投入就能解决的事

钱固然重要,但在这种层级的问题上,边际效用会迅速下降,资本多到一定程度未必能换来突破。正如Ilya所言,科研确实需要算力,但无需绝对最多的算力。真正需要的是正确的问题和新的方法。

真正的阶跃式突破,往往需要少数科学家带领高强度小团队(未来可以是AI),配备先进工具持续攻坚,资源不必无限大,但组织须足够专注、足够聚焦。然后,再加上好运。

硅基君:如果说Scaling Laws终结了,这对AI行业意味着什么?

邹阳:我认为会带来两大变化。

第一,资源分配需调整。除非你是少数具备“跨越式突破”能力的顶级团队,否则不应继续将主要资源和精力押注于追逐下一次大台阶。更现实的选择,是把现有资源投入,踏踏实实嵌入业务,做工程化、做产品、做闭环。

第二,应用的窗口期实则已到来。原因非“模型进化多快”,而是相反:模型能力增量变小,反而意味着边界更稳定、技术投入回报可预期性更强

同时,当前模型已具备产生业务价值的足够能力,你完全可以基于它重新梳理流程、重做场景,将过去做不成的事变为可规模化的产出。

行业经验的结构化复制,才是这波AI最大的价值

硅基君:如果AI技术停留在“半山腰”,应用机会何在?

邹阳:我觉得此前市场方向有所偏离。2023年、2024年,大家关注力主要集中于模型上。超大客户花几千万购买闭源模型,这在国内屡见不鲜;随之而来的是模型效果不佳,然后便微调,各种调整。

并非微调无效,微调开源模型是对数据、算力、人才要求均极高的提效方式,应在判断现有模型能力不足时尝试使用。

令人感慨的是,即便当前2025年即将结束,许多人仍未正确掌握通用大模型的使用方式

如今谈模型应用,若有人在我面前说,把这些数据训练一下,让模型学习一下,就成,我基本判定其为外行。

新技术的最大价值在于它能成为真正意义上的“数字专家”,解决产业中所有知识性工作无法流水线化的问题。

硅基君:请详细阐述?

邹阳:以电力系统为例,特高压换流变设备极为精密昂贵,每年因其导致的系统停运占比高达40%。长期高压高热下,内部绝缘油在局部放电、过热和受潮时会裂解出氢气、乙炔、一氧化碳等气体。

以往这项工作全靠老师傅定期巡检,老师傅查看传感器数据,进行计算、比对,结合数十年经验和直觉,大概率可判断故障,进行预防性检修。但人会出错,也无法24小时值守。

若将老师傅的工作拆解,其所做无非是读取传感器数值,进行计算,根据计算结果查询手册,从而“照章办事”

我们现在让智能体模拟老专家,对故障进行判断。例如,简单的各种气体比值计算和预警,无非是将传感器接口对接,实时获取数据,然后计算相关特征值,如氢气含量和增速、乙烯与乙炔比值等,再查阅手册,判断是否需注意和报警。

面对复杂问题,智能体通过调用知识库(历史案例库),也能给出可能原因

例如,数据显示某三个比值异常,系统在数据库中找到两个“非常相似”的历史案例,针对案例详细内容展开分析,提取不同点,再结合处置手册及现有数据与历史数据的差异,让模型进行特定范围推理。

硅基君:这相当于将专家经验“结构化复刻”,那我们如何抽离这种规则?

邹阳:调研。我们只需把问题问清,让专家用自身语言回答即可。一次一小时的访谈,结合大模型就能把这套业务逻辑整理得明明白白,配合图谱技术,沉淀为结构化知识。再请专家修改完善,这在过去几乎不可想象。专家自己写不出经验,技术人员问不出专业问题。

更重要的是,企业中大量散落的“过程文档”——方案、手册、邮件往来、各类内部记录,现都能被模型读懂、分类、提炼。人机协同,能自动将隐性经验抽出,变为显性、可复用的逻辑。

通过以上两种方式,企业就能将自身的“运转规则”完整沉淀下来,再拆解为一个个场景的具体需求,围绕这些场景打造成能稳定运行的智能体。

硅基君:如今大模型能胜任的事,以前的AI做不到吗?

邹阳:做不到,原因有二。

一是成本,需将所有规则写成if-else,逻辑梳理得极其精细,不容丝毫歧义。成本巨大,且基本无法覆盖真实业务的复杂性。一线情况或其中一环变动,便需投入大量资源更新迭代。

二是大部分业务规则源自一线业务员经验,在电网、制造业,最有价值的经验掌握在老师傅手中。他们不懂代码,也写不出SOP(标准作业程序),甚至沟通也较费劲,但他们看一眼变压器数据,凭直觉就知问题所在。

这种“隐性经验”,是传统AI无法处理的盲区。

大模型带来的真正革命,是它让“经验逻辑”变成了可理解的事物。师傅总得带徒弟,你让老师傅像教徒弟般用大白话讲出他的判断逻辑,模型就能读懂,并结合现场数据给出解决方案。

硅基君:在电网检修这类工作中,用大模型做判断,会否不够严谨?

邹阳我认为我们在推进工程落地,看重的是效果。这也是此次技术革命需改变的一个认知。

有人觉得既然都是机器工作,那业务场景中的判断必须像传统软件般严丝合缝,正确率须达100%。但在真实的基层一线,数十万工作人员每日都凭经验做判断。那为何一个比老师傅更稳定、不疲劳、不走神、逻辑更一致的AI,反而不能用?

硅基君:电网变压器只是极小场景,您认为类似变压器这种适合AI落地的场景还有多少?

邹阳:变压器仅是电网系统中很小的一个设备,一个变压器可能有100个场景,一个变电站可能有1000个,理论上所有故障研判方式都能用类似方法完成。国家电网130多万员工,从事一线设备检测的,约十万人。

置于其他行业,此类场景可能更多。绝大多数人日常所做的,其实是依照前辈经验、照着SOP一条条往下走的流程性工作。无非部分场景规则复杂些,需注意的事项多些。那他总归要教徒弟,但凡他能教徒弟,他就一定能教大模型。

我认为一家企业中80%-90%的工作,都是类似照章办事的工作。所谓“脑力工作”,其实很多也只是照章办事、沿着经验走流程

最近听朋友提及一个案例,一家全球顶尖制造业厂商,需为某款设备开发一种新材料,要求具备某些特殊属性。流程如下:

工程师先上Google、百度查资料,看论文,搜文献,再回到企业自有知识库及个人硬盘里翻阅以往项目报告,寻找类似案例。

然后凭借经验和直觉,在脑中形成大致方案:材料选哪些、比例如何配、怎样混合、预计效果如何。最后再根据此方案去实验室配料、测试、出结果。

听起来像“高智商、高门槛”流程,但细看,本质就是经验复用 + 文献检索 + 配方组合。模型现有能力,已完全覆盖化学博士所需的知识深度。

只要对老专家工作流程拆解得足够细致,基于大语言模型的智能体完全能复刻这些专家的隐性经验和实现方式。

它不仅能理解需求,还能自动从历史文档中找出相关材料,生成配方方案,甚至连“为何如此配”的依据都能解释清楚。过去一位工程师需花费数天甚至数周才能做出的初步方案,现在模型几分钟即可完成。

硅基君:从梳理行业Know-how再输入AI,最终输出智能体解决方案,整个过程需多久?成本几何?

邹阳:此过程确需人力,但投入可控。三到六个月,就能将一位资深专家脑中的判断逻辑、经验路径梳理清楚,做成可部署的数字专家系统

接下来要做的,只是将这些“边角”补全。前文提及,一个变压器可能有100个场景,一个变电站可能有1000个,一个城市或需覆盖上千甚至上万个场景。将所有场景做完,确需三到五年,有些行业甚至要十年。

更关键的是,规模化成本极低。以往的规模化是复制真人,复制真人成本极高,选拔、学习、实践,几十年过去,还有学习效果漏斗和人本身的缺陷。现在不同了,当你用大模型将一个城市几千个场景落实一遍,数字专家便如软件般,可直接复制到下一城市、下一省份,无病无灾,24小时不间断工作,边际成本几乎趋零。

硅基君:当下,AI技术在场景落地的关键是什么,技术还是其他因素?

邹阳:AI技术的革命性已足够强大,足以颠覆诸多行业,但真正稀缺的是“会用的人”

我再直言不讳,目前模型能力大致相当于“普通博士生”。即便招聘顶尖博士生进公司,不给背景、不教业务、不搭流程,就指望他们凭直觉直接完成工作,这是不可能的。

许多高价值、复杂的工作,并非模型独立完成,而是“人带着模型一起做出”。像陶哲轩这类顶级数学家,能将AI变为解决难题的工具,换一个不具备相同方法论和判断力的人,即便拥有同样模型,也做不出同样结果。

硅基君:这类人具备何种特质?

邹阳:我认为主要有两点:第一,知晓现有AI能力边界在哪;第二,懂得如何将能力嵌入任务、流程和评价体系

这种人往往非纯技术专家,也非算法工程师,更非研究型科学家,而是产业中的工程应用型人才:既懂业务结构,又理解模型能力边界,能配合AI完成可交付、可复制、可持续优化的系统。

这类人现今非常稀少,甚至在我看来比算法工程师更稀缺。但基于此次革命性技术的软件将越来越面向业务人员,赋能他们具备此种技术能力,让普通业务人员只要会画流程图、会结构化表达,就可利用数字化工具为自身降本提效。

科技平权平的是普通人也可用AI构建数字化应用解决自身真实需求的权利。

硅基君:这会对当前TO B生态产生何种影响?

邹阳:我有一个大胆论断,未来大型企业或不再需要那么多外部供应商,尤其是那些依赖人海战术的服务模式也将被替代

以往企业难以实现数字化,是因找不到足够懂业务、懂软件、懂流程的人;数字化成本高、周期长、失败率还特高,故需各种外包或服务商帮其“补足能力”。

但未来不同。当企业拥有自身模型、自有数据、第一手场景,加上一两支懂得使用模型的小团队,大部分传统意义上的“外部开发能力”都会被内化。

硅基君:何种toB公司能存活?

邹阳:我认为仅两类:一类掌握行业Know-how,另一类拥有数据积累的公司

硅基君:垂直大模型概念渐被证伪,那垂直Agent会存在吗?

邹阳:垂直大模型与垂直Agent是两码事。模型是能力,Agent是商品。正如一位医疗行业专家,并不意味着他能解决医疗场景中所有具体问题。

垂直大模型不成立是因性价比太低,通用大模型已能解决80%的问题。而垂直Agent的核心,是将行业中的碎片化规则转为可被大模型调用的指令和流程。它售卖的并非模型能力,而是“最后一公里”的解决方案

中国强调系统性落地,美国聚焦单点需求

硅基君:如何看待中美在AI上的路线差异?

邹阳:中美的差异既有客观原因,也有主观原因。

客观原因很好理解,国内算力确实紧张。许多团队非不想做,而是没有足够多的卡。

国内一家宣称发力AI的大厂,手中仅5000张卡。算力不足的直接后果,是模型无法在细节上做足够多实验。国外是一百个方向同时跑,国内往往只能聚焦十分之一。

这决定了大模型创业公司在国内很难成功,能做此事的,唯有大厂。

硅基君:那主观原因呢?

邹阳中国无论产业政策还是企业决策都更为务实。技术能否解决生产环境中的实际问题,是判断的首要原则。解决不了,就不会投资,也不会引进;解决得了,便迅速推进。

此种态度与过往一些技术潮流形成对比:当年区块链、元宇宙、大数据都曾受大规模追捧,但真正落地的极为有限。经历这些周期后,中国企业对“价值验证”一事变得更为敏感。

这与国外靠资本驱动的逻辑全然不同。国外可能一家三五人的创业公司,估值几千万美元是常态。资本互相购买、互相推动,高估值本身就是玩法的一部分。泡沫会积累,也迟早会破裂一次。但从长期看,AI的价值又确非泡沫,它能在十年尺度上带来深刻的结构性变化。

硅基君:这种路线差异,会导致何种结果?

邹阳:美国的AI落地更多是自下而上,围绕商业场景中的明确问题展开。法律、财务、内容审核,这些环节清晰、边界分明,也易于验证效果。大多数美国AI公司,最终仍走向具体、可快速变现的工具化产品。

中国的路径自有其特色。国内企业将AI置于生产核心环节:排产、工艺、设备运行、供应链调度。这些场景复杂、周期长,短期不会产生可见回报,但关乎企业底层效率,故持续投入。国企的参与更为典型,许多项目前期投入大、见效慢,却依然愿意长期建设。

因此,我们选择的方向,是朝更细更深之处迈进。非只做几个易验证的点,而是进入真正的产业现场,去拆解、解决那些分散于千行万业中的具体问题,再将这些经验沉淀为更通用的能力体系。

唯有让技术在最难、最碎、最真实的业务中接受检验,才能判断其真正边界。未来真正改变企业运行方式的,也不会是几个亮眼的演示,而是这些深埋于流程中的突破。