“今年可能是AI for Science的爆发年,众多能力提升,我们将能完成更多事情。”在AGI-Next前沿峰会上,清华大学教授、智谱首席科学家唐杰如此展望。
据悉,该峰会由清华大学基础模型北京重点实验室主办,旨在探讨全球AGI发展的新趋势及其面临的挑战。
活动还邀请了Kimi创始人兼CEO杨植麟、阿里Qwen技术负责人林俊旸、加拿大皇家学院院士及香港科技大学荣休教授杨强,以及腾讯高调宣布的CEO首席科学家姚顺雨。中国“开源四杰”中已有三家齐聚一堂。
“开源四杰”由DeepLearning.AI创始人、斯坦福大学兼职教授吴恩达提出,他曾在社交媒体上表示,尽管美国在顶尖闭源模型上保持领先,但在开源领域,中国的DeepSeek R1、Kimi K2、Qwen3和GLM-4.5等模型已超越美国。
近期,中国大模型企业在资本市场动作频频。就在本次峰会举办前三天,智谱已在港交所上市。本周,智谱股价已涨至158港元,市值达700亿港元。
几周前,月之暗面宣布完成5亿美元融资,估值达43亿美元。
“开源四杰”中未出席本次活动的DeepSeek,也传出将于2月中旬发布DeepSeek V4的消息,外媒称其将具备更强的编码能力。
2026年初,中国大模型市场已热闹非凡。
在圆桌座谈环节,姚顺雨虽未现身活动现场,但远程参与了关于AGI新范式的讨论。
“对ToC而言,大多数人无需如此强大的智能。如今ChatGPT的能力虽有所提升,但大多数人仍感受不到。”姚顺雨表示,大模型在ToC和ToB、模型与应用分层两个维度上均出现分化。
“AI Coding正在重塑计算机行业的运作方式,人们不再写代码,而是与电脑交流。”姚顺雨认为,ToB行业正呈现模型分化趋势,即大多数用户更倾向于使用最强模型。“最强模型每月200美元,次强或较弱模型分别为50美元/月、20美元/月。我们发现许多美国人愿意为最强模型支付额外费用。”
姚顺雨表示,AI在ToC应用上的垂直整合已见成效,无论是ChatGPT还是豆包,模型与产品紧密迭代。但对ToB而言,趋势似乎相反:模型越来越强、越来越好,但应用层仍有许多环节需用好的模型。
“DeepSeek的崛起标志着大模型排队做对话和搜索的时代结束。”唐杰坦言,DeepSeek的横空出世让他开始思考下一阶段应“让AI做实事”。经团队长时间讨论后,他们决定专注于Coding。
谈及RL(强化学习)正成为行业主流训练方式时,尤其是RLVR(可验证奖励强化学习),姚顺雨分享了他的观察。“自主学习面临‘在什么场景下,基于什么奖励函数做’的问题。例如,掌握某一业务场景的代码能力与学习某一自然科学是完全不同的方法论。”
“OpenAI利用用户数据不断弥合聊天风格差异。Claude已完成95%的代码项目。”姚顺雨提到,Cursor团队已在真实环境中实现按小时级别用最新用户数据持续学习与迭代。
“我对今年会有大的范式革新充满信心。在持续学习、模型记忆能力甚至多模态领域都可能出现新变革。”唐杰表示,学术界正跟上工业界的步伐。
“两年前高校老师连卡(算力)都没有。如今许多高校都配备了算力并开始研究大模型和持续学习。”唐杰认为学术界正加速AI研究的土壤孵化新的创新种子。”
“今年将是RLVR爆发年。”谈及Scaling模式的进化时唐杰表示在RLVR爆发前行业内只能通过人类反馈数据训练但人类反馈数据“噪音”多且场景单一。“如果我们有可验证环境机器就能自我探索发现反馈数据实现自我成长。”
唐杰提到的RLVR指在推理训练中只对模型是否完成目标给反馈而不评判表达方式或推理风格。系统会依据预设规则自动判断结果:如数学是否得到唯一解、代码是否通过测试。模型仅在验证成功时才获得奖励失败则不奖励从而调整推理策略。
RLVR的反馈可自动生成标准一致因此同一套推理任务可反复大规模用于训练。
展望下一个AGI的范式和行业未来唐杰表示:“我们虽取得一些开源成功但差距并未缩小。”
同时唐杰也分享了他对国产模型发展方向的看法。他认为多模态适应期将在2025年后未来关键在于模型能否像人类一样整合视觉、声音、触觉等信息形成整体感知能力这是多模态能力跃迁的核心难题。
“当前模型在记忆、持续学习与自我认知上仍不足。如何形成自我认知是下一个阶段最具挑战也最值得投入的方向。”唐杰表示对于大模型是否有自我认知在基础模型研究领域一直存在争议。“我认为模型的自我认识是有可能的这个领域值得我们探索。”
本文由主机测评网于2026-06-10发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260647877.html