人工智能正迈入新阶段,不仅能回答问题,还能主动采访人类。Anthropic推出的Interviewer工具让模型与1250名真实用户深度对话,自动生成提纲、实时追问、进行聚类分析,最终绘制出一张‘人类情绪雷达图’。这一次,人类成为了AI的深入研究对象。
难以想象,有一天AI真的开始系统性采访人类了。
内容绝非‘你今天过得怎么样’这类日常闲聊,而是遵循一套完整的质性研究方法。
自主撰写提纲,动态追问,执行主题聚类与情绪分析,最后输出跨行业的‘人类情绪雷达图’。
这就是Anthropic最新发布的Interviewer,一个充满未来感的工具。
它在一周内与1250名真实的职场人士、创作者、科学家对话。
所有细节都被完整记录,再被AI压缩成可量化的结构。
这是一幅AI时代的‘群体心理画像’,也是大模型首次真正深入人类内心世界。
Anthropic推出的Interviewer,表面看是普通功能更新,实则悄然跨越了一条技术界线。
它不再仅是回答问题的模型,而是能像一位训练有素的研究者般工作。
带着明确假设与研究目标,主动发起访谈、实时追问、整理情绪,最终将所有内容转化为可量化数据。
过去,这套流程仅能依赖人类研究团队完成,如今首次由AI接手。
访谈从一个看似简单的问题开始,背后却有完整规划过程。
Interviewer会根据研究目标自动生成访谈提纲。哪些主题重要、应在何处追问、哪些情绪信号需捕捉,都在模型内部预先组织。
然后,它以自然开场进入对话:
这是一场持续10–15分钟的深度访谈。
AI会根据回答调整节奏;当用户犹豫或绕开时,它会及时将对话拉回主线。
访谈结束后,Interviewer将完整记录交给分析器,自动进行主题聚类、提取关键观点、识别情绪倾向,并根据职业、行业、角色生成可视化‘情绪雷达图’。
Anthropic的自动主题聚类工具Clio。用虚构对话示例说明Clio的分析步骤概述
过去研究团队需数周完成的质性工作,现在AI能在规模化场景中稳定产出。
Anthropic采访了1250人,并将访谈内容匿名公开,供外部研究者使用这批数据。
根据受访者反馈,工具稳定性远超预期:超过97%参与者给出高满意度评价,几乎所有人都认为访谈‘准确捕捉了自己的想法’。
这项研究揭示了AI的另一种潜能:自第一次大规模问卷诞生以来,人类质性研究方法首次出现扩展。
对AI行业而言,这是另一方向的突破——不仅能理解文本,还能理解人。
在结果出炉前,人们都自以为能猜到大众对AI的看法。
事实却是,不同职业人群正以截然不同的方式迎接同一未来。
Anthropic将1250份访谈按主题聚类后,绘制的情绪倾向气泡图。蓝色越多代表越悲观,黄色越多代表越乐观,气泡越大代表该主题提及人数越多
在普通职场人访谈中,谈及最多的是‘效率’。
他们的描述惊人一致:AI能节省时间,让繁琐工作变轻松,甚至重新带来些许‘掌控感’。
高达86%受访者称它加快工作速度,65%对当前使用状况感到满意。
加速流程、减少机械任务,这是他们最直接的体验。
但当访谈深入,另一更隐蔽情绪浮现——他们害怕显得‘过度依赖AI’。
69%受访者坦言,会刻意压低使用痕迹,担心被同事认为不够专业、邮件像AI代写,从而影响团队地位。
这种矛盾也体现在数据中:他们在访谈中将AI使用描述为协作式:
我仍主导工作,只是让AI加速某些程序。
但Anthropic对Claude使用记录的分析显示,更大比例使用实为自动化——将任务直接交给模型完成,再自行微调。
即便如此,他们仍反复强调‘关键部分还得我来做’,并称此为‘监督AI、管理流程、保留判断’。
受访者的自我描述与实际使用之间的差异。上方为‘协作’,下方为‘自动化’。蓝色越深表示任务更复杂
数据表明,人们在描述AI使用方式时,更倾向强调‘控制感’,但实际行为中自动化比例更高。
在1250名创作者访谈中,几乎每个情绪点都成对出现——效率与焦虑并行,灵感与身份危机共存。
创作者样本的情绪主题可视化。蓝色越多代表越悲观,黄色越多代表越乐观,气泡越大代表该主题提及人数越多。来源:Anthropic创作者群体访谈分析
摄影师修片周期从12周缩至3周,以往难以实现的效率现成常态。
内容写作者描述一天能完成过往两倍产量;音乐制作人让模型生成一长串词组,从中寻找灵感。
这些案例显示,AI确实压缩了创作的前期门槛与后期流程。
但效率越高,他们反而越不安。
70%创作者担心客户认为作品‘太像AI生成’,担忧品牌受损,怕被同行视为放弃原创。
更现实的是收入。配音行业某些工种已被模型直接取代;产品摄影正加速被替换。
有创意总监坦言:
我知道每次使用AI,都意味着某位摄影师少了一天收入。
创作者一边视AI为工具,称自己掌握最终决定权,但下一句又不自觉承认:有时,它给的方向比我想到的更清晰。
创作者样本的六维情绪雷达图。可见满意度高,但信任和安全感较弱,担忧明显高于其他群体
科学家们不像创作者那样焦虑经济压力,也不像普通职场人担心‘形象问题’。
他们最大顾虑是可靠性。79%科学家明确表示:在重要任务上,AI不够稳定,不足以承担生成假说或设计实验的责任;27%认为模型理论能力仍明显不足。
因此,他们更多在文献综述、代码调试、论文写作等环节使用AI。
而决定实验方向、判断数据异常、根据细微现象推断等关键步骤,仍保留在人工手中。
科学家们也不太担心失业。
他们常举那些无法数字化的隐性知识例子:细胞培养颜色的微妙变化、某些仪器的‘操作手感’、实验室未写入SOP的经验判断。
这些任务,机器根本无法感知。
科学家对AI在不同研究环节的态度分布。蓝色越多越悲观,黄色越多越乐观,气泡越大代表该主题提及人数越多
有趣的是,他们并不排斥AI,相反,91%科学家期待未来有一个真正的AI研究伙伴。
他们的不信任,源自技术不成熟,而非职业焦虑。
科学家样本的六维情绪雷达图。满意度高、挫折明显、信任偏低,担忧相对较弱
将这三类人访谈并列时,情绪差异已不足以解释他们的选择。
这些态度背后,实则是各自工作结构中的压力点。
普通职场人之所以小心翼翼,是因身处高度依赖印象管理的组织环境。
AI对他们并非纯粹工具,而是会改变‘他人如何看待我专业性’的信号。
他们的谨慎,非来自技术恐惧,而是来自关系网中位置松动的担忧。
创作者的紧张感源自完全不同结构:他们的收入、风格、作品价值,本质上在市场中直接竞争。
AI造成的压力不是用不用,而是‘用了后,会否削弱我所出售的人格与原创性’。
科学家的态度则属另一端:他们的专业身份不靠‘可见成果速度’维持,而是靠长期积累的判断力与可靠性。
AI在这里不是竞争者,而是可能犯错的系统。
他们的谨慎更多来自学科本身——错误代价太高,无法轻易托付。
将这三种结构并列,可见更本质分野:每个群体真正关注的,都不是AI多强大,而是AI触动了他们哪一块‘不可替代的核心’。
AI本身无恶意亦无倾向,它只是悄无声息地让每个人最脆弱的部分显形。
同一技术落在不同工作结构,却引发三种截然不同的心理震动。
因此,这三类人对AI的态度差异,非技术本身造成,而是由各自职业结构、评价体系与生存方式决定。
AI只是让这些隐性分野首次浮出水面。
访谈仅是可见部分,真正关键的是那些一直被忽略的‘关系变量’。
Anthropic真正追求的,是过去所有模型开发者看不见却至关重要的部分:人们在聊天窗口外,如何与AI建立关系。
Anthropic之前的经济指数仅能分析聊天行为,却无法触及用户对技术的感受、期望与边界感。
而正是这些看不见的变量,才是决定大模型未来影响力的关键。
Anthropic Interviewer是他们首次尝试补全这一块。
它放弃传统问卷预设问题的做法,采用深度访谈,让用户在对话中自然流露隐含信息:
他们如何平衡效率与身份,如何解释AI使用方式,担忧什么,又愿意交出什么。
这些内容不会出现在聊天记录,但却决定人们是否愿继续使用AI、能否信任它、允许它进入工作流哪部分。
对Anthropic而言,这些‘隐性变量’不仅影响产品迭代,也影响他们理解人与模型的合作走向。
这一研究真正想回答的是,当AI越来越像工作伙伴,它该如何被训练,才能融入不同人的生活而不破坏原有结构。
这1250份访谈,是Anthropic首次将视角彻底回归人本身。
未来的模型,将更像从这种‘人与AI关系’中生长,而非仅从技术中诞生。
此轮深度访谈,将一个静默而深刻的事实呈现在台面:
AI并非在取代谁,而是以最直接的方式,迫使不同人群回答同一问题——我在工作中的核心究竟是什么?
普通职场人在关系中寻找答案,创作者在作品中寻找答案,科学家在可靠性中寻找答案。
Anthropic正在做的,就是收集这些隐藏在工作背后的情绪与心理边界,让未来模型不只满足于回应任务,更能对使用者保持足够敏感。
1250份访谈仅是一个开端。
而我们,也正通过这些访谈,逐渐看清自己正在成为怎样的群体。
参考资料:
https://www.anthropic.com/research/anthropic-interviewer?source=i_email&medium=email&content=Nov2024ClaudeStyles&messageTypeId=140367
本文由主机测评网于2026-02-09发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/20260224119.html