当前位置:首页 > 科技资讯 > 正文

语音输入革命:Typeless如何重塑我们的输入习惯

语音输入革命:Typeless如何重塑我们的输入习惯 语音输入 Typeless AI交互 输入效率 第1张

假如几年前有人预言,未来的写作可能不再依赖键盘,我或许只会把这当作一个玩笑。那时,我正沉迷于机械键盘的敲击声,研究轴体、键帽、键程,甚至购入过多款知名键盘品牌,如Cherry、Filco、NiZ、Keychron,还曾为了提升打字效率,专门学习双拼输入法。

我的注意力都集中在消费的乐趣上,很少真正思考:敲键盘,真的是输入的最佳方式吗?

真正的转折,其实发生在我开始高频使用各种AI App的这两年。当AI App里的“语音转文字”功能越来越好用时,我第一次真正意识到“语音输入这件事或许值得重视”。这些App里的语音转写,明显比传统输入法里的语音要聪明得多:它不仅能听清我在说什么,还能自动加上标点,帮我整理口语化的表达,即使在我说得磕磕绊绊时,最后呈现的文字依然通顺。

语音输入革命:Typeless如何重塑我们的输入习惯 语音输入 Typeless AI交互 输入效率 第2张

主流的AI几乎都覆盖了语音转文字功能|图片来源:极客公园

更关键的是,它和后面的AI是连在一起的——我说完一句话,看到的不只是干巴巴的转写结果,而是AI根据这段话给我的反馈和回答。那一刻我第一次有了直观的感受:语音不再只是一个“替代键盘的输入方式”,而是直接接在AI交互前面的那一层。

第二个真正改变我看法的,是我在和AI交互的过程中,越来越清楚地意识到:语音比打字流畅得多。和真人聊天不同,和AI交互时,我可以不管错别字、不管格式;也不需要一上来就组织成一段“体面”的文字;甚至可以中途换一个角度,AI依然能跟得上。持续一段时间后,我发现一个很直观的变化:在越来越多的场景里,我不再想“敲一段字问它”,而是更想“按住麦克风直接说”。

Typeless初体验:它真的听得懂我在说什么

我开始尝试一些语音输入法。Wispr算是其中名气最大的一个,但真正用下来,其实很难令人满意。它的转录速度略显拖沓,有一个较为尴尬的等待时间;中文识别的准确率也算不上理想,尤其是遇到一些专有名词或者中英文混排的场景,经常需要手动修补。

闪电说(原名:代体)走的是本地小模型路线,它几乎把“速度”做到了极致,转写过程几乎是“你刚说完,字就出来了”,而且完全免费。这种即时反馈在一开始确实给人非常强烈的爽感。

但是也因为本地小模型的原因,它在准确率上就差强人意了。比如中英文混排、技术名词夹杂口语、或者我说话节奏稍微快一点的时候,错误率会明显上升。

我还尝试过一些其他的语音输入法,包括豆包输入法(iOS端)、微信输入法、Whisper Keyboard,甚至是苹果听写(因为更原生),但它们或多或少都因为一些问题而无法让人完全满意。

最后,我就注意到了Typeless,并且最终常驻在我的电脑中。

语音输入革命:Typeless如何重塑我们的输入习惯 语音输入 Typeless AI交互 输入效率 第3张

我之前曾经简单测试过各个语音输入法,并做了一张四象限图。Typeless处于第二象限:速度中上,但文字的质量最高。|图片来源:极客公园

如果和之前试过的那些工具相比,Typeless带来的改变并不在于“速度快了一两秒”,而是在于它大幅降低了出错和返工的成本。很多语音输入法的问题根本不在于转录的速度,而是它无法正确识别说话人的意图。

Typeless给我的感觉刚好相反:它似乎真的理解“你想说什么”,而不是“你每个字到底是怎么说的”。哪怕我中途改口、补充、打断自己,它也会尽量在结果里帮我拼出一个完整的、读起来顺畅的版本。

几乎没有“缺点”,但有三点担忧

如果单纯从“工具好不好用”这个角度来评价,Typeless在我这儿其实很难挑出什么硬伤。识别足够稳,意图理解在绝大多数场景下靠谱,桌面端集成顺滑,免费额度对个人用户来说也够用(每周4000词)。

语音输入革命:Typeless如何重塑我们的输入习惯 语音输入 Typeless AI交互 输入效率 第4张

在使用Typeless的20天中,我总共输入了接近8000词,平均每天200词

真正令人担心的地方,反而不在产品本身,而在它所处的环境。

第一个担忧是大公司的入场。当Typeless成为日常工作的核心输入层时,很难不去想象另外一种可能性:如果哪一天操作系统自己提供了一套同样水准、甚至更强的语音输入能力……

第二个担忧是免费本地模型阵营的持续挤压。随着硬件继续演进、本地模型持续变强……用户对“语音转文字这件事本身应该是免费的”这种预期,很难完全逆转。

键盘,会被取代到什么程度

回头看这几年自己折腾输入工具的历程……我越来越强烈地意识到一个事实:我们过去为键盘付出的那些努力……是在帮一套并不那么“顺手”的设计擦屁股。

QWERTY布局本身并不是为了人体工学而生……它诞生于机械打字机时代……我们刻意牺牲了一部分人的效率……再用盲打训练、打字课和大量练习……

语音输入革命:Typeless如何重塑我们的输入习惯 语音输入 Typeless AI交互 输入效率 第5张

这种流动更符合人类自然的输出方式……真正开始高频用语音和AI交互之后……才发现……所谓“自然输入方式”……不只是速度快一点……而是它把我从很多不必要的负担里解放了出来……