当前位置:首页 > 科技资讯 > 正文

钉钉AI硬件DingTalk A1引领空间智能革命,推动AI普惠落地

钉钉AI硬件DingTalk A1引领空间智能革命,推动AI普惠落地 AI硬件 钉钉 空间智能 AI普惠 第1张

本文约4500字,建议阅读9分钟

AI硬件领域的竞争正变得空前激烈。

从Meta两位前员工打造的智能戒指Stream,到集成AI助手的眼镜和便携录音卡片,甚至吊坠与腕带,科技巨头们正致力于将人工智能嵌入所有可穿戴设备。即使没有马斯克关于“边缘智能兴起”的预言,硅谷早已打响一场围绕交互入口的硬件争夺战。

国内大厂同样不甘落后。在8月底代号为“蕨”的大版本发布会上,钉钉首款AI硬件产品Dingtalk A1正式亮相,它继承了钉钉的硬件基因。在阿里内部,这是一支拥有硬件成功经验的团队。对外界而言,许多人以为这只是智能硬件赛道的一次狙击,而“大厂下场”仅为本就拥挤的赛道增添了更多关注。

但钉钉为何选择此时进军AI硬件?答案可能出乎多数人意料。

当许多人高举高打,抛出AI改变世界的宏大叙事以吸引眼球和资金时,钉钉却选择了不同的路径。

AI若想真正改变世界,必须让大多数人参与其中,但首先,人类需帮助AI理解物理世界。让每个人都能主动借助工具,协助AI提升对现实世界的认知,工具普惠是必经之路。

在钉钉看来,AI普惠绝非少数公司自上而下灌输所能实现。它由每位普通员工在日常体验中塑造:可能是一张表格的搭建,一次钉钉客服的点对点响应,或是一位钉钉程序员的客户拜访。一切发生得琐碎而细微,如同细水长流。

但若能深入理解钉钉的长期坚持,便会认同:Dingtalk A1并非为战胜某家公司或成为爆款而生,它是钉钉AI普惠理念落下的首子,也是一段漫长征程的起点。

“沉默的大多数”与永远在场的AI

截至2024年底,全国有6000多万家企业,中小企业占绝大多数,它们维系着中国经济的活力。

然而,当AI浪潮轰鸣而至,许多小微企业却离涛声很远。他们害怕被时代抛下,“必须做AI”已成为共识,但如何实施和应用却茫然无措。他们成为了AI热浪中“沉默的大多数”。

技术门槛是首要障碍。

如今AI大模型仍是少数人的生产力工具,需不断调校和优化,对于缺人、缺钱、更缺时间的小公司而言,应用门槛极高。以义乌为例,十人以下企业占绝大多数,它们没有明确“管理部门”,很少“开会”,更谈不上流程。

“我们在短视频App上天天刷到AI,感觉AI已统治世界。但真正走进企业,你会发现许多企业连基本办公软件都用不好。”一位钉钉服务商指出。

许多企业对AI大模型落地无从下手,也无精力磨合各种AI工具。这些用户期待一款产品,能以最简单、高效的方式解决日常问题,切实提升生产力。

这就是中国最真实的企业级市场:层次丰富,环境复杂。

因此,AI真正走向普惠,不在于让模型更强悍,而在于让门槛归零。

作为在这一市场沉淀多年的产品,钉钉清楚软件作为入口已触及其边界:软件有极高启动成本。正如钉钉团队调研中一位客户所说:“当我真正想记录什么时,根本来不及打开软件。”

这正是DingTalk A1的源起,其使命明确:让“AI永远在场”。

爱迪生点亮电气时代第一盏白炽灯,苹果以触摸屏iPhone开启移动互联网时代,每次技术革命飞跃,终以物理硬件为载体。毕竟,人类只能与可触碰物品产生更密集互动。

作为钉钉的首个AI硬件,DingTalk A1以卡片式录音笔形式呈现,主要基于“无感”使用考虑。AI硬件毕竟是新事物,交互界面须足够简洁清晰,才能最快上手。DingTalk A1贴合手机,实现全场景、全天候随身携带,且可一键操作,用户只需做两件事:按键,开始。

例如一位销售公司负责人,有时会想到待办事项或解决方案,便随手打开A1录制。“比打开手机找App方便多了,别人不会奇怪,自己也方便。”

如果几年后回头看,DingTalk A1的意义远不止一张卡片录音笔,它更像打通数据世界与物理世界的桥梁,也是“空间智能”时代的关键占位。

开启空间智能的第一把钥匙

11月10日,美国斯坦福大学教授李飞飞发文提出“空间智能”概念,认为这将成为AI技术的下一高峰。当前以大型语言模型为代表的AI系统,虽能熟练生成文字与图像,却仍停留在“语言世界”中,缺乏对现实空间、物理规律与因果关系的真正理解。

人与人、人与物之间的互动,构成了远超语言复杂性的世界。无疑,新一代AI大模型需真正具备能动性,像人类一样在现实世界中感知、推理和行动。

当下,我们通过摄像头、麦克风、传感器等丰富输入方式,借助语音智能、视觉智能、触觉智能,让AI逐渐打开“五感”,一步步理解物理空间中人类行为的意义,最终在几何、物理层面“重建”世界。

若认同这一路径,DingTalk A1无疑是建立语音智能的开端。

通过这个无门槛接口,AI能获取不间断的非结构化、多维度空间信息。

相比普通智能手机只能调用麦克风,DingTalk A1配置了5颗全向麦克风加1颗骨传导麦克风,可识别8米内声音,使信息获取的广度和深度远超手机。

如果说此前注入企业级大模型的数据是涓涓溪流,在DingTalk A1配合下,汇入的数据将如滔滔江河。

例如与DingTalk A1配合的AI产品“AI听记”增加了“可视化录音”功能,利用DingTalk A1的5颗麦克风,能通过声纹识别不同发言人及其在空间中的方位。回溯录音时,界面会以可视化方式呈现谁在何时、何处发言,还原会议现场。

最终,钉钉希望这些信息沉淀为“知识”和“智慧”,在工作场景中提升普通员工、企业主的生产力,帮企业构建自身AI能力,形成从数据汇集到模型构建、辅助决策、反馈学习的完整闭环。

显然,在这一闭环形成过程中,人与AI的关系已从单向输入-输出进化为双向人机协同。由DingTalk实现软硬件一体后,钉钉AI能将DingTalk收集的信息处理完毕,并嵌入整个工作流程。

对于钉钉用户,助力“决策和行动”是最显性变化,让钉钉从被动工作软件变为有自我驱动力的参谋者和顾问。

一个案例是,某位做房车进出口的创业者,给海外客户打电话后,需记录并翻译,接着自己写邮件。现在用DingTalk A1开会后,电话会议直接实时转成中文,并根据会议要求生成邮件,他只需做最后修改和把关。

对于员工,这种效率提升不会增加额外时间成本,还能帮他们不断精进业务。例如一位社工开会用Dingtalk A1录音,钉钉能通过AI整理文本,并根据会议纪要提供分析和总结。AI助手会告知在任务中使用了什么方法,哪些方面已到位,哪些方面存在不足。

这是钉钉引领的一场无声变革,在无数企业的办公室、仓库中,钉钉用AI解放了中小企业管理者和一线员工的生产力。正如钉钉服务中心员工莫商所说:“钉钉所做的事,其实是在铺设管道。只有修通这条管道,提供极致服务,AI能力、算力和数据才能真正流入每家小企业。”

阿里真正跑出来的第一款AI硬件

在企业级AI市场,数据源于全国数千万企业,是AI应用的原料,而算力是AI世界的基座。

纵观全球,AI的算力、人才军备竞赛已至中场。进入空间智能AI时代后,各大势力的版图将继续延展。

以企业级AI硬件为例,中国珠三角超强产业链已彻底消解硬件制造门槛。成本几十元就可在深圳造出卡片式录音笔。显然,AI硬件最终比拼的仍是AI软件能力,甚至是整个系统和生态的开发能力。

最后留在场中的只有不断进击的强者。正因如此,AI普惠的责任必然由钉钉这样的国民级应用承接。毕竟,钉钉的AI背靠整个阿里集团的算力、技术和人才。

作为阿里的重要布局,钉钉直观展现了其实力。今年发布会上,钉钉一次发布了包括钉钉One、AI搜问、AI表格、AI听记、智能硬件DingTalk A1等超10款AI产品。这种产品矩阵的数量、质量和推出速度,绝非创业公司可企及。

背靠阿里技术也让钉钉AI产品呈现惊人效能。钉钉AI表格和阿里云ADB-PG数据库团队协同推出存算一体架构O-Table,支持单表千万行实时更新,仅需秒级。

钉钉的DingTalk A1,严格意义上是阿里真正跑出的首款AI硬件。它也是行业内首家加入实时转写功能的卡片式录音笔。实时意味着没有给AI模型修改时间,容错率极低。算力侧,若将事后转写变为同步转写,模型须具备处理高并发场景的算力。

而目前市场上的卡片式录音笔只能在录音结束后上传云端,再通过外部大模型处理,之所以没有实时转写,是因为这一功能会让转写难度和成本指数级攀升。

更重要的是,卡片录音机普遍按时长计费,只计算最终上传的录音时长,一旦加入实时转录,需重构整个收费模式。所以目前产品缺失这一看似简单的功能,实则是算力鸿沟的必然结果。

开路者的重任落到钉钉头上,正是这样的壁垒让DingTalk A1敢于尝试实时转写。而且DingTalk A1提供了1000分钟免费时长,为行业最高,其中实时转写不计入时长。

毋庸置疑,DingTalk A1作为硬件产品,并非高ROI之作。产品背后的算力成本短期内很难摊薄。

实际上,钉钉在AI软件侧也在行业首次使用了AI按效果付费模式。在当下企业对AI付费产品仍存犹疑时,作为头部企业,钉钉愿垫付中小公司入场的“门票”,最终目的是让企业“敢用、能用、用得起AI”。

这算得上是钉钉对AI普惠的某种担当。

“他们真的想把这个东西做好”

“很多人认为精英能改变世界,不是的,是脚踏实地的精英改变世界。”在8月的Dingtalk A1发布后,钉钉创始人无招接受36氪采访时说。

政治哲学学者迈克尔·桑德尔曾提出,精英的成功不仅依靠自身努力,还有出身、运气甚至时机的因素。一旦精英认为这种幸运理所应当,就会陷入“精英的傲慢”。

作为阿里的核心产品,钉钉天然能调动大量资源、资金,起跑线远超同侪。

例如这次钉钉发布的十多款产品身后,都有阿里大开大合的支援。仅以“AI听记”为例,钉钉就与通义实验室完成了超1亿小时的音视频数据训练。最终对中国30多种方言、全球140种语言的识别准确率达90%——他们用一个月时间,跑完了创业公司几年的路程。这种产品能力落实到DingTalk A1上,就能在语音转写能力上快速拉开差距。

这是很容易让人骄傲的现实:产品的成功固然有团队自身努力,但绝不能否认钉钉“生而优越”的资源禀赋。

不过,钉钉团队始终对这种“优越感”保持距离,力求坚持谦逊、脚踏实地的作风。

如果深入钉钉内部,你会发现这是一群从高层到基层都很“落地”的团队。管理层和研发人员都要亲自走访客户,倾听客户看似琐碎的疑问,包括找不到入口、为何收费等。DingTalk A1的产品团队也是如此,有用户在小红书上称赞:在社区中,每天都有官方人员一条一条回复用户问题,可见他们真的想把这个东西做好。

在刚结束的双11,DingTalkA1已成为录音笔相关品类的黑马,在抖音、天猫等平台销量和成交额领先,短短一周销量过万,把一批新老玩家甩在身后。从发布到现在仅3个月,钉钉已开始用逆袭姿态改造这个赛道。

对于钉钉来说,DingTalk A1只是真正定义AI时代全新工作方式的开始,也是构造AI改变人类生活拼图的开始。钉钉数亿用户、甚至竞争对手,都是这群构造者中的一员,他们会竞争、会合作,但都会奔往共同的未来。