当前位置:首页 > 科技资讯 > 正文

豆包输入法深度评测:AI语音技术的新篇章

如今,互联网企业竞相推出输入法,这似乎已成为行业新趋势。从微信到豆包,各大平台都希望在用户的手机输入界面占据一席之地。

一个月前,笔者就在社交平台小红书看到豆包输入法内测的消息,起初以为是小道传闻,没想到本周五正式版已悄然上线。

豆包输入法深度评测:AI语音技术的新篇章 豆包输入法  语音识别 AI技术 产品评测 第1张

或许有人会问,当前输入法市场已被搜狗、讯飞、百度等老牌厂商瓜分,字节跳动为何还要涉足?实际上,从百度、微信到搜狗,行业正兴起“AI+输入法”热潮,豆包作为字节跳动AI技术的集大成者,自然不会缺席。

因此,这款顶着“AI新贵”光环诞生的豆包输入法,究竟是实力派还是花瓶?是来颠覆市场,还是仅仅凑个热闹?笔者近日将其安装使用,为大家带来深度体验报告。

豆包的野心,一目了然

首先,让我们看看它的外观设计。

豆包输入法的图标基于其大哥“豆包APP”设计,增加了语音输入的麦克风标志。第一眼看去,你可能会误以为这是一款语音聊天软件。

豆包输入法深度评测:AI语音技术的新篇章 豆包输入法  语音识别 AI技术 产品评测 第2张

但这恰恰暗示了其核心定位:一款主打语音功能的输入法!

首次启用时,豆包提供两个选项:“完整体验模式”和“基础打字模式”。其中“基础打字模式”值得称赞,它承诺数据完全在本地运行,不会上传任何信息,为注重隐私的用户提供了安心选择。

豆包输入法深度评测:AI语音技术的新篇章 豆包输入法  语音识别 AI技术 产品评测 第3张

进入主界面,设计非常简洁,甚至略显简陋。顶部是显眼的“语音输入”设置入口,下方才是“键盘输入”、“辅助输入”等常规选项。在设置界面中,“语音转文字”功能也位于最顶部。

这再次证实了笔者的猜测:语音和AI才是其核心武器。

豆包输入法深度评测:AI语音技术的新篇章 豆包输入法  语音识别 AI技术 产品评测 第4张

在核心语音功能上,豆包祭出大招——一个150MB的智能离线语音模型。这意味着即使在地铁、电梯等无信号环境,用户也能顺畅使用语音输入。这无疑是个实用功能,毕竟目前许多输入法的离线语音识别表现不佳。

豆包输入法深度评测:AI语音技术的新篇章 豆包输入法  语音识别 AI技术 产品评测 第5张

不过,在最基础的键盘输入方面,V1.0版本的豆包显得较为稚嫩。

它仅提供常规26键和9键布局,五笔、手写等功能尚未支持。皮肤商城?目前不存在。整个设置页面简洁如白纸。

豆包输入法深度评测:AI语音技术的新篇章 豆包输入法  语音识别 AI技术 产品评测 第6张

可以说,豆包输入法的第一印象优缺点鲜明:语音输入是重中之重,而传统键盘打字尚处于起步阶段。

语音实力,堪称王牌

聊完外观,接下来是实战体验。输入法的好坏关键取决于实际输入表现。

先说键盘打字体验,客观而言,略有粘滞,不够跟手。实际输入时,总感觉按键响应和候选词出现速度稍慢,快速打字时体验不佳。这对输入法来说是个影响基础体验的短板。

豆包输入法深度评测:AI语音技术的新篇章 豆包输入法  语音识别 AI技术 产品评测 第7张

但不得不说,豆包输入法确实体现了AI实力,其“智能联想”功能能根据输入内容自动匹配相关词汇。

例如,输入“西游记的作者是”,它会自动跳出“吴承恩”和“明代吴承恩”,甚至“明代”等选项,智能化程度很高。

豆包输入法深度评测:AI语音技术的新篇章 豆包输入法  语音识别 AI技术 产品评测 第8张

再谈其主打的语音输入。既然键盘是短板,那它的王牌——语音输入表现如何?

为了检验真实水平,笔者找来行业重量级选手:公认的语音识别霸主——讯飞输入法,与豆包进行正面PK。

第一轮测试,从简单的新闻联播片段开始。

豆包输入法深度评测:AI语音技术的新篇章 豆包输入法  语音识别 AI技术 产品评测 第9张

测试选取了一分多钟、百余字的片段。

讯飞输入法准确无误地完成了转写,这毫不意外,毕竟它是该领域的王者。豆包同样没有让人失望,与讯飞表现相当,轻松通过测试。

豆包输入法深度评测:AI语音技术的新篇章 豆包输入法  语音识别 AI技术 产品评测 第10张

当然,新闻联播可能过于简单,因此笔者又选取了一分钟左右的中英混合片段进行测试。

这一轮主要测试普通场景下的语音识别,以及对英语的识别能力。

豆包输入法深度评测:AI语音技术的新篇章 豆包输入法  语音识别 AI技术 产品评测 第11张

测试结果约200字,双方都有一些小错误,但总体令人意外。

除专有名词外,讯飞在英语识别上错误较多,例如简单单词“jacket”整段识别错了2次。且多次丢失逗号,影响文本可读性。

而豆包整段下来,除“何穗”、“SJYP”等名词外,其余全部正确,标点使用恰当,整体表现优异。

豆包输入法深度评测:AI语音技术的新篇章 豆包输入法  语音识别 AI技术 产品评测 第12张

虽然未进行更深入测评,但豆包输入法的语音识别能力绝对属于第一梯队。其准确率、智能标点和中英混合识别能力,已可与讯飞较量,甚至在部分语义理解上略有优势,可见其融合的AI技术强大。

另外,据悉其粤语识别能力突出,于是笔者又选取星爷的一段影片进行测试。

豆包输入法深度评测:AI语音技术的新篇章 豆包输入法  语音识别 AI技术 产品评测 第13张

结果确实“好犀利”,整段250字,仅错一处,其余全对。星爷的语速在剧中并不慢,这能做到几乎全对,粤语识别实力非常厉害。

豆包输入法深度评测:AI语音技术的新篇章 豆包输入法  语音识别 AI技术 产品评测 第14张

体验下来,笔者觉得豆包输入法从根本上不是一个传统“打字工具”。

毕竟它主打“豆包同款语音输入法”,产品逻辑非常清晰:弱化传统键盘,全力投入“AI+语音”。

豆包输入法深度评测:AI语音技术的新篇章 豆包输入法  语音识别 AI技术 产品评测 第15张

在这条赛道上,它的对手与其说是功能全面的微信输入法,不如说是同样以语音技术为核心的讯飞输入法。豆包的出现,最应感到危机感的可能就是讯飞。

当然,作为输入法,它在打字手感上稍有欠佳,但整体瑕不掩瑜,而且作为初版就有如此惊艳表现,后续稍加优化,定能在输入法市场掀起波澜。

它用强大的AI语音能力,展示了输入法未来的另一种可能性——或许有一天,我们真的可以动口不动手,让输入法成为真正的AI助理。

至于它能走多远,取决于字节跳动的资源投入,以及它能否在补齐短板的同时,继续强化自身优势。