当前位置:首页 > 科技资讯 > 正文

透视AI:看见,才能治理

透视AI:看见,才能治理 AI透明度 AI标识 模型规范 治理路径 第1张

引言:模糊的认知,难以驾驭的AI

我们正处在一个AI无处不在,却又难以察觉其存在的时代。它悄然渗透进我们的社交、内容、服务、消费之中,甚至影响我们的情绪、偏好和行为。然而,我们真的了解它在哪里、做了什么、由谁控制吗?如果看不清,就无法信任;没有信任,更无从谈起治理。

关于AI透明度的讨论,正指向一个基础却至关重要的问题——在AI时代,“可见性”意味着什么?我们又该如何让AI真正“可见”?

本文为腾讯研究院 AI&Society 海外名家对话系列首篇,访谈嘉宾:曹建峰(腾讯研究院高级研究员)。

为何“看见”AI至关重要?

当我们在互联网上接收信息、互动时,我们面对的是真实的人类,还是“以假乱真”的AI?随着生成式AI在社交、创作、服务等领域的广泛应用,虚假信息、身份欺诈、深度伪造等风险日益凸显。因此,“AI活动标识”(AI Activity Labeling)逐渐成为全球共识,多个监管机构如中国和欧盟已将AI透明度义务写入法律,要求服务提供者明确标示哪些内容由AI生成,哪些互动来自AI系统,以帮助用户识别伪造信息,提高警惕,降低误信和受骗风险。这是当前AI透明度政策最直接、最基本的功能。

然而,这只是冰山一角。透明度的价值远不止于此。AI系统正逐渐从执行命令的工具进化为具有自主性的智能体(AI Agent),能够浏览网页、执行交易、编写代码、操控设备。这种新能力模糊了AI与现实世界的界限。但无论是政府监管者、产业从业者,还是学界和公众,对AI的运行逻辑、风险链条和社会影响仍知之甚少,甚至处于“认知真空”状态。

例如,关于“AI说服(AI persuasion)”的社会影响就是一个颇具争议的议题。当AI能精准模仿人类语言,理解心理需求,甚至影响情绪时,它是否可能在社交媒体和短视频平台等日常场景中悄然塑造我们的观点、价值判断甚至行为模式?其影响程度、传播范围和持续时间目前都缺乏证据支持。更大的问题是——我们甚至不知道去哪里找答案。

治理AI,首先要看清AI。要真正回答上述问题,仅靠想象和理论推演远远不够。我们必须收集大量现实世界的证据,了解AI如何运作、如何影响人类。而透明度制度的长远价值正在于此:为研究、评估和应对AI风险提供真实的观察视角和第一手数据。例如,要研究“AI说服”对人类的认知、情感、行为及社会秩序的影响,前提是能准确区分哪些互动来自AI,哪些来自真实的人类。在此,AI标识制度不仅有助于用户增强识别能力,也为平台提供追踪、分析和管理AI活动的技术支撑,为研究者提供收集证据、评估风险和制定科学政策的可能。

进一步说,透明度还承担着缓解焦虑、建立信任的重要功能。技术发展远超我们的理解速度,导致广泛的治理焦虑:我们不知道哪些风险最重要最紧迫,也无法确认是否忽视了更深层的隐患。这在某种程度上阻碍了AI在社会中的推广应用。

在风险未完全厘清、AI能力快速演进的阶段,透明度机制能缓解各方的不安,从风险焦虑回归治理理性,用“已知证据”缓解“未知恐惧”。不是盲目信任,而是在“看得见”的基础上进行理性判断。透明度机制不仅限于AI标识,还包括模型规范、可解释性技术等,旨在平衡信息差:缓解我们对AI技术的认知“黑箱”,缓解政府、产业界、学界和社会公众之间的信息不对称。我们对AI了解得越多,才能放心使用,甚至大胆创新。

在“知之甚少”的今天,“看得见”本身就是一种不可或缺的力量。透明度机制赋予我们这种能力:了解AI如何运作、如何与人类互动以及产生何种影响。可以说,在AI技术不断演进和扩张的当下,透明度是理解、信任和治理AI的关键。

如何有效实施“AI标识”?

在当前的AI治理中,“AI标识”是最早落地且推进最快的透明度机制之一。中国的《人工智能生成合成内容标识办法》及国家强制性标准已实施并取得阶段性成果。欧盟的《人工智能法案》(EU AIA)第50条也规定了AI系统提供者的标识义务。随着第50条的推进实施,行业讨论从“是否需要标识”转向“如何有效标识”。

首先,是标内容还是也标“行为”?随着AI自主性的提升,智能体不仅能生成内容,还能主动“做事”:浏览网页、发送邮件等。这类操作已超出传统内容生成的范畴。然而,现有法律多聚焦于对内容的标识,尚未明确涵盖AI的自主行为。例如,大量AI账户同步点赞、转发某条信息可能制造“虚假热度”,扰乱信息生态。因此,将此类行为纳入标识范围值得进一步关注。

其次,谁来嵌入水印标识?分层义务如何设定?并非所有AI服务提供者的能力都相当。上游开发者拥有模型层面的控制能力,而下游应用开发者往往只是调用已有模型。若对所有主体施加相同义务可能打击中小创新者的积极性。例如,欧盟也在讨论是否应设置“分层义务”:上游模型开发者负责嵌入水印;下游应用开发者负责配合检测等。此外,不同类型的AI系统在应用场景和风险特征上存在差异,是否也应制定差异化的透明度要求也是未决问题。

最后,谁来验证水印标识?检测工具授权给谁?嵌入水印是一回事,能否验证是另一回事。如果水印只对生成方可见则失去透明度价值。但一旦水印检测工具公开可能被攻击者绕开或篡改。因此需要在透明和稳健间权衡。目前可能的方案是将检测工具授权给负有平台责任的关键节点如社交媒体平台等同时保持技术细节不公开。

欧盟正在编制关于EU AIA第50条的实践准则预计明年5月完成以回应上述问题。

“模型规范”:为AI“立规矩”与“守规矩”?

除了AI标识外透明度的另一探索方向是“模型规范”。简单来说模型规范是一份由企业撰写并公开的文件说明他们对模型的期望和行为边界等。

模型规范的意义不仅在于技术内部的“操作手册”,还在于它是面向公众的透明化机制让用户了解系统设计和互动方式保障知情权与选择权。

但模型规范的最大问题是:企业可轻易承诺但公众难以验证承诺是否兑现。“模型规范遵守”成为讨论核心。

目前判断模型规范遵守度主要依赖用户反馈、系统卡或事故报告披露等但仍有不足。因此有观点认为企业不仅应披露规范内容还应公开遵守技术流程评估结果事故或违规事件等并持续跟踪更新。

“模型规范遵守”仍在探索期尚无统一标准围绕这一机制存在诸多开放问题。

“第一”,模型规范遵守是否应强制?目前公开发布规范的企业较少如果过早将“模型规范”及“遵守”作为法定义务可能抑制探索和创新。同时监管层面也存在执行难题:谁来验证?如何验证?如何设定差异化标准?

“第二”,哪些“模型规范遵守”的信息应当公开?透明度不等于“完全透明”。哪些环节数据指标和技术方法可以披露哪些应保护需要在政府要求公众需求和企业利益间找到平衡。

“第三”,如果模型未能完全遵守规范企业是否应当承担责任?技术发展不成熟偶发违背规范如果一旦“越界”就承担责任对技术发展过于苛刻。应关注企业是否遵守规范是否披露事故情况是否及时修正问题等方面。

结语:以透明度建立可验证可反馈可改进的治理路径

正因为我们对AI的认识仍远远不足透明度才显得尤为关键。它让我们更好地了解AI的真实运作弥合技术发展与社会理解之间的落差。它不仅帮助用户识别互动对象规避风险更重要的是为整个社会提供面对技术不确定性时的认知保障是治理研究和政策制定的基础前提。

无论是AI标识还是模型规范或其他透明度机制和方法都在尝试建立一条可验证可反馈可改进的治理路径。

唯有当我们真正看清AI做了什么怎么做的为何这么做我们才有可能理性判断:它应该做什么。