智东西9月29日消息,据多家媒体透露,全球顶尖AI科学家、IEEE Fellow许主洪(Steven Hoi)已加入阿里通义,投身通义大模型研发。
许主洪拥有超过20年的AI产业和学术经验,是新加坡管理大学终身教授,曾任新加坡南洋理工大学终身副教授。他在AI领域发表了超过300篇顶级学术论文,论文引用次数突破5万次,并被斯坦福大学评为全球顶尖1%的AI科学家之一。
作为多模态大模型领域的领军人物,许主洪曾任Salesforce副总裁,从零开始构建了Salesforce在亚洲的AI研究生态系统。他还于2023年创立了多模态AI创企HyperAGI,是业内少有的产学研多栖AI专家。
▲许主洪
2025年2月,许主洪加入阿里并担任阿里集团副总裁、智能信息事业群首席科学家,向智能信息事业群总裁吴嘉汇报,负责AI To C业务的多模态基础模型及智能体(Agents)研究与应用。
原规划中,许主洪的核心任务是组建顶级AI算法团队,整合通义(应用)、夸克、天猫精灵等内部资源,推动多模态交互产品迭代,加速AI To C商业化。
今年6月,在2025上海世界移动通信大会上,许主洪发表了题为《多模态大模型发展与演进》的演讲。他以夸克App的AI超级框、AI相机等功能为例,讲解了多模态大模型的应用场景。
▲许主洪以夸克为例讲解多模态大模型应用场景
然而,加入阿里7个多月后,许主洪被传加入通义实验室团队。这意味着他可能将从面向AI To C商业化研发转向更基础前沿的大模型研发。
如果消息属实,这将是阿里一次重大的人才调整,也标志着阿里在多模态大模型研发领域再次加码。
当前,阿里通义大模型正处于“拼迭代速度”、“多模态发展”的关键时期。许主洪这样的顶尖产学研多栖且有分量的AI专家对阿里来说至关重要。
在9月底举办的2025云栖大会期间,阿里云智能集团首席技术官、通义实验室负责人周靖人透露,连续发布数十款模型背后有战略考量:全球AI模型进展都在加速,整个通义家族一直在与全球AI领域的领先者竞争。AI已经进入加速期,比拼的是模型迭代效率;同时模型从单模态到多模态的演进是必然趋势,阿里期待在多模态方面取得更多创新和突破。
许主洪或是目前阿里最适合做这件事的人。他曾在今年5月的蚂蚁技术开放日演讲中提到,当下用统一的框架做理解和生成是多模态大模型的一大演进趋势。但这一领域发展尚处于初级阶段,需要实践验证。
▲许主洪讲解统一多模态模型产业发展脉络
许主洪指出,统一理解与生成的多模态大模型面临众多技术挑战。在全模态交互挑战方面,目前支持音、视、图、文全模态交互的公开单模型非常少见;在理解与生成统一方面,图像和语意的理解生成统一模型鲜有出现且效果难以平衡。
在6月的演讲中,许主洪提到:“多模态Agent AI时代才刚刚开始。未来要真正达到AGI我们还需要解决很多技术难题包括多模态大模型的基础能力Agent智能体的核心功能模块数据世界的连接与操作物理世界的交互与控制等等都有很大的挑战但这也是未来多模态大模型行业的机遇。”
截至目前阿里及许主洪方未对此进行评论。
本文由主机测评网于2026-05-02发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260542144.html